Aacap 13 Regresion Multiple y Modelado

56
7/31/2019 Aacap 13 Regresion Multiple y Modelado http://slidepdf.com/reader/full/aacap-13-regresion-multiple-y-modelado 1/56 REGRESIÓN MÚLTIPLE Y MODELADO Objetivos Contenido del capítulo c a p í t u l o 13 Extender las técnicas de regresión del capítulo anterior, con el fin de mane-  jar más de una variable explicativa para predecir una cantidad Examinar situaciones de toma de decisiones en las que se puede utilizar la regresión múltiple para hacer predicciones Interpretar los resultados obtenidos con paquetes de computación que efectúan análisis de regresión Probar hipótesis acerca de las regresiones Utilizar las técnicas de modelado para incorporar variables cualitativas a las ecuaciones de regresión Aprender cómo ajustar curvas a los datos Entender la importancia de los residuos en el análisis de regresión 13.1 Análisis de regresión múltiple y correlación 566 13.2 Deducción de la ecuación de regresión múltiple 567 13.3 La computadora y la regresión múltiple 574 13.4 Inferencias sobre parámetros de población 582 13.5 Técnicas de modelado 595 Estadística en el trabajo 608 Ejercicio de base de datos computacional 609 Del libro de texto al mundo real 609 Términos introducidos en el capítulo 13 610 Ecuaciones introducidas en e capítulo 13 611 Ejercicios de repaso 612 13

Transcript of Aacap 13 Regresion Multiple y Modelado

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 156

REGRESIOacuteN MUacuteLTIPLE

Y MODELADO

Objetivos

Contenido del capiacutetulo

c a p iacute t u l o

13

bull Extender las teacutecnicas deregresioacuten del capiacutetuloanterior con el fin de mane- jar maacutes de una variableexplicativa para predecir

una cantidadbull Examinar situaciones de tomade decisiones en las que sepuede utilizar la regresioacutenmuacuteltiple para hacerpredicciones

bull Interpretar los resultadosobtenidos con paquetes de

computacioacuten que efectuacuteananaacutelisis de regresioacuten

bull Probar hipoacutetesis acerca delas regresiones

bull Utilizar las teacutecnicas de

modelado para incorporarvariables cualitativas a lasecuaciones de regresioacuten

bull Aprender coacutemo ajustar curvasa los datos

bull Entender la importancia delos residuos en el anaacutelisisde regresioacuten

131 Anaacutelisis de regresioacuten muacuteltipley correlacioacuten 566

132 Deduccioacuten de la ecuacioacuten deregresioacuten muacuteltiple 567

133 La computadora y laregresioacuten muacuteltiple 574

134 Inferencias sobre paraacutemetrosde poblacioacuten 582

135 Teacutecnicas de modelado 595bull Estadiacutestica en el trabajo 608

bull Ejercicio de base de datoscomputacional 609

bull Del libro de texto al mundoreal 609

bull Teacuterminos introducidos en elcapiacutetulo 13 610

bull Ecuaciones introducidas en ecapiacutetulo 13 611

bull Ejercicios de repaso 612

13

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 256

Un fabricante de fotocopiadoras y procesadores de texto pequentildeospara oficina paga a sus vendedores un salario base reducidomaacutes una comisioacuten igual a un porcentaje fijo de las ventas de

cada vendedor Uno de ellos afirma que esta estructura salarial esdiscriminatoria para las mujeres Los salarios base actuales de los nuevevendedores de la compantildeiacutea son los siguientes

La directora de personal observa que el salario base depende de laantiguumledad del vendedor en la compantildeiacutea pero no sabe coacutemo utilizar losdatos obtenidos para darse cuenta de si depende tambieacuten de su sexo ysi existe discriminacioacuten hacia las mujeres Los meacutetodos que analizaremosen este capiacutetulo le permitiraacuten averiguarlo

131 Anaacutelisis de regresioacuten muacuteltipley correlacioacuten

Como se mencionoacute en el capiacutetulo 12 podemos utilizar maacutes de una variable independiente para esti-mar la variable dependiente e intentar de esta manera aumentar la precisioacuten de la estimacioacuten Esteproceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten Estaacute basado en las mismas su-posiciones y procedimientos que encontramos al utilizar la regresioacuten simple

Considere al agente de bienes raiacuteces que desea relacionar el nuacutemero de casas que la firma vendeen un mes con el monto de su publicidad mensual Ciertamente podemos encontrar una ecuacioacuten de

estimacioacuten sencilla que relacione a estas dos variables iquestPodemos tambieacuten hacer maacutes precisa nues-tra ecuacioacuten incluyendo en el proceso de estimacioacuten el nuacutemero de vendedores que emplea cada mesProbablemente la respuesta sea siacute Y ahora como deseamos utilizar tanto el nuacutemero de agentes deventas como los gastos de publicidad para predecir las ventas mensuales de casas debemos utilizarregresioacuten muacuteltiple no simple para determinar la relacioacuten

La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten dispo-nible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variablespuede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo siagregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estima-cioacuten que describa la relacioacuten con mayor precisioacuten

La regresioacuten muacuteltiple y el anaacutelisis de correlacioacuten implican un proceso de tres pasos como el queusamos en la regresioacuten simple En este proceso

1 Describimos la ecuacioacuten de regresioacuten muacuteltiple2 Examinamos el error estaacutendar de regresioacuten muacuteltiple de la estimacioacuten y3 Utilizamos el anaacutelisis de correlacioacuten muacuteltiple para determinar queacute tan bien la ecuacioacuten de re-

gresioacuten describe los datos observados

Ademaacutes en la regresioacuten muacuteltiple podemos observar cada una de las variables independientes yprobar si contribuyen de manera significativa a la forma en que la regresioacuten describe los datos

Pasos de la regresioacutenmuacuteltiple y lacorrelacioacuten

Ventaja de laregresioacuten muacuteltiple

Uso de maacutes deuna variableindependiente paraestimar la variabledependiente

Agentes de ventas hombres Agentes de ventas mujeresMeses como Salario base Meses como Salario base

empleado (en miles de doacutels) empleada (en miles de doacutels)

6 75 5 62

10 86 13 87

12 91 15 94

18 103 21 98

30 130

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 356

En este capiacutetulo veremos coacutemo encontrar la ecuacioacuten de regresioacuten de mejor ajuste para un co junto dado de datos y coacutemo analizar la ecuacioacuten obtenida Aunque mostraremos coacutemo se puede hcer regresioacuten muacuteltiple a mano o con una calculadora pronto seraacute evidente que no conviene hacersiquiera un problema real pequentildeo a mano Afortunadamente hay muchos paquetes de software dponibles para hacer regresiones muacuteltiples y otros anaacutelisis estadiacutesticos Estos paquetes realizan ldquooperaciones numeacutericasrdquo y lo dejan libre para concentrarse en el anaacutelisis del significado de la ecucioacuten de estimacioacuten resultante

La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacuteccas de variables ficticias podemos incluir factores cualitativos tales como el sexo en nuestra regsioacuten muacuteltiple Esta teacutecnica nos permitiraacute analizar el problema de discriminacioacuten con que abrimos

presente capiacutetulo Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutenicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de nuetras ecuaciones de estimacioacuten

Paquetes de softwarepara regresioacuten

Ejercicios 131

Conceptos baacutesicos

13-1 iquestPor queacute utilizamos regresioacuten muacuteltiple en lugar de regresioacuten simple al estimar una variable dependien 13-2 iquestDe queacute manera se utilizaraacuten las variables ficticias en nuestro estudio de regresioacuten muacuteltiple

13-3 iquestA queacute se refiere la palabra muacuteltiple en la frase regresioacuten muacuteltiple 13-4 La duentildea de una cadena de almacenes desea predecir las ventas mensuales a partir del tamantildeo de la cdad donde se localiza una tienda Despueacutes de ajustar un modelo de regresioacuten simple decide que deincluir el efecto de la temporada del antildeo en el modelo iquestSe puede hacer esto utilizando las teacutecnicas del prsente capiacutetulo

13-5 Describa los tres pasos del proceso de anaacutelisis de regresioacuten muacuteltiple y correlacioacuten 13-6 iquestLos procedimientos utilizados en la regresioacuten muacuteltiple difieren mucho de los usados en regresioacuten si

ple Explique su respuesta

132 Deduccioacuten de la ecuacioacutende regresioacuten muacuteltiple

Veamos coacutemo podemos calcular la ecuacioacuten de regresioacuten muacuteltiple Por conveniencia utilizaremsoacutelo dos variables independientes en el problema que trabajaremos en esta seccioacuten Sin embargtenga en mente que en principio la misma clase de teacutecnica se aplica a cualquier nuacutemero de variabindependientes

El Servicio Interno de Contribuciones (IRS Internal Revenue Service) de Estados Unidos etratando de estimar la cantidad mensual de impuestos no pagados descubiertos por su departamende auditoriacuteas En el pasado el IRS estimaba esta cantidad con base en el nuacutemero esperado de horastrabajo de auditoriacuteas de campo En los uacuteltimos antildeos sin embargo las horas de trabajo de auditorde campo se han convertido en un pronosticador erraacutetico de los impuestos no pagados reales Comresultado la dependencia estaacute buscando otro factor para mejorar la ecuacioacuten de estimacioacuten

El departamento de auditoriacuteas tiene un registro del nuacutemero de horas que usa sus computador

para detectar impuestos no pagados iquestPodriacuteamos combinar esta informacioacuten con los datos referetes a las horas de trabajo de auditoriacuteas de campo y obtener una ecuacioacuten de estimacioacuten maacutes precpara los impuestos no pagados descubiertos cada mes En la tabla 13-1 se presentan esos datos pra los uacuteltimos 10 meses

En la regresioacuten simple X es el siacutembolo utilizado para los valores de la variable independiente En

regresioacuten muacuteltiple tenemos maacutes de una variable independiente Entonces seguiremos usando X pero ag

garemos un subiacutendice (por ejemplo X 1 X 2) para diferenciar cada una de las variables independientes

Siacutembolos adecuados

Un problema queilustra la regresioacutenmuacuteltiple

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 456

En este problema X 1 representa el nuacutemero de horas de trabajo de auditoriacutea de campo y X 2 el nuacute-mero de horas en computadora La variable dependiente Y seraacute los impuestos reales no pagados des-cubiertos

Recuerde que en la regresioacuten simple la ecuacioacuten de estimacioacuten Y ˆ ϭ a ϩ bX describe la relacioacutenentre las dos variables X y Y En regresioacuten muacuteltiple debemos extender esa ecuacioacuten agregando unteacutermino para cada nueva variable En siacutembolos la ecuacioacuten 13-1 es la foacutermula que se usa cuando te-nemos dos variables independientes

Ecuacioacuten deestimacioacuten pararegresioacuten muacuteltiple

Definicioacuten de lasvariables

Datos de los registros deauditoriacuteas del IRS de losuacuteltimos 10 meses

Tabla 13-1 X 1 X 2 Y

Horas de trabajo de Horas en Impuestos realesauditoriacutea de campo computadora no pagados descubiertos

Mes (dos ceros omitidos) (dos ceros omitidos) (millones de doacutelares)

Enero 45 16 29

Febrero 42 14 24

Marzo 44 15 27

Abril 45 13 25

Mayo 43 13 26

Junio 46 14 28

Julio 44 16 30Agosto 45 16 28

Septiembre 44 15 28

Octubre 43 15 27

Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 [13-1]

Ecuaciones normales

Y ϭ na ϩ b1 X 1 ϩb2 X 2 [13-2]

X 1Y ϭ a X 1 ϩ b1 X 2

1 ϩb2 X 1 X 2 [13-3]

X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩb2 X 2

2 [13-4]

donde

bull Y ˆ ϭ valor estimado correspondiente a la variable dependientebull a ϭ ordenada Y

bull X 1 y X 2 ϭ valores de las dos variables independientesbull b1 y b2 ϭ pendientes asociadas con X 1 y X 2 respectivamente

Podemos visualizar la ecuacioacuten de estimacioacuten simple como una recta en una graacutefica de manerasimilar podemos representar una ecuacioacuten de regresioacuten muacuteltiple de dos variables como un plano

como el que ilustra la figura 13-1 Se trata de una forma o figura tridimensional con profundidadlargo y ancho Para obtener una idea intuitiva de esta forma tridimensional visualice la interseccioacutende los ejes Y X 1 y X 2 como un rincoacuten de una habitacioacuten

La figura 13-1 es una graacutefica de los 10 puntos de la muestra y el plano alrededor del cual estospuntos parecen agruparse Algunos estaacuten arriba del plano y otros abajo del mismo modo que los pun-tos estaban arriba y abajo de la recta de regresioacuten simple

Nuestro problema consiste en decidir cuaacutel de los planos que podemos dibujar seraacute el que mejorse ajuste Para hacer esto de nuevo utilizaremos el criterio de miacutenimos cuadrados y localizaremosel plano que minimice la suma de los cuadrados de los errores es decir de las distancias de los pun-tos alrededor del plano a los puntos correspondientes sobre el plano Usemos nuestros datos y las si-guientes tres ecuaciones para determinar los valores de las constantes numeacutericas a b1 y b2

Uso del criterio demiacutenimos cuadradospara ajustar un planode regresioacuten

Visualizacioacuten de laregresioacuten muacuteltiple

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 556

Error Punto correspondienteen el plano

Punto observado

Plano formado a traveacutesde los puntos de la muestraY = a + b 1X 1 + b 2X 2^

a = ordenada Y

X 1

X 2

Y FIGURA 13-1

Plano de regresioacutenmuacuteltiple para 10datos

Podemos obtener a b1 y b2 los coeficientes del plano de regresioacuten resolviendo las ec13-2 13-3 y 13-4 Obviamente la mejor manera de calcular todas las sumas implicadas en ecuaciones es elaborar una tabla para recolectar y organizar la informacioacuten necesaria comen la regresioacuten simple Esto se presenta en la tabla 13-2 para el problema del IRS

Ahora utilizando la informacioacuten de la tabla 13-2 en las ecuaciones 13-2 13-3 y 13-4 obtres ecuaciones con tres constantes desconocidas (a b1 y b2)

272 ϭ 10a ϩ 441b1 ϩ 147b2

12005 ϭ 441a ϩ 19461b1 ϩ 6485b2

4013 ϭ 147a ϩ 6485b1 ϩ 2173b2

Cuando resolvemos estas tres ecuaciones de manera simultaacutenea obtenemos

a ϭ Ϫ13828

b1 ϭ Ϫ 0564

b2 ϭ Ϫ 1099

Sustituyendo estos tres valores en la ecuacioacuten de regresioacuten de dos variables (ecuacioacuten 13-l)mos una ecuacioacuten que describe la relacioacuten entre el nuacutemero de horas de trabajo en auditoriacuteaspo el nuacutemero de horas de computacioacuten y los impuestos no pagados descubiertos por el dep

to de auditoriacuteasY ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

ϭ Ϫ13828 ϩ 0564 X 1 ϩ 1099 X 2

El departamento de auditoriacuteas puede utilizar esta ecuacioacuten mensualmente para estimardad de impuestos no pagados que va a descubrir

Suponga que el IRS desea aumentar la cantidad de detecciones de impuestos no pagados ete mes Como los auditores capacitados son escasos el IRS no tiene la intencioacuten de contratnal adicional El nuacutemero de horas de trabajo en auditoriacuteas entonces permaneceraacute en el niv

Uso de la ecuacioacutende regresioacuten muacuteltiplepara estimaciones

Obtencioacuten de a b 1y b 2 resolviendo lasecuaciones 13-213-3 y 13-4

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 656

tubre alrededor de 4300 horas Pero con el fin de aumentar las detecciones de impuestos no p

el IRS espera aumentar el nuacutemero de horas en computadora a cerca de 1600 Como resultad X 1 ϭ 43 larr 4300 horas de trabajo en auditoriacuteas de campo

X 2 ϭ 16 larr 1600 horas de tiempo en computadora

Sustituyendo estos valores en la ecuacioacuten de regresioacuten para el departamento de auditoriacuteanemos

Y ˆ ϭ Ϫ13828 ϩ 0564 X 1 ϩ 1099 X 2

Y ˆ ϭ Ϫ13828 ϩ (0564)(43) ϩ (1099)(16)

Y ˆ ϭ Ϫ13828 ϩ 24252 ϩ 17584

Y ˆ ϭ 28008 larr Detecciones estimadas de $28008000

Por tanto en el pronoacutestico para noviembre el departamento de auditoriacuteas espera enconevasioacuten de impuestos cercana a 28 millones de doacutelares para esta combinacioacuten de factores

Hasta este punto nos hemos referido a a como la ordenada Y y a b1 y b2 como las pendieplano de regresioacuten muacuteltiple Pero para ser maacutes precisos debemos decir que estas constantericas son los coeficientes de regresioacuten estimados La constante a es el valor de Y ˆ (en este catimacioacuten de los impuestos no pagados) si tanto X 1 como X 2 tienen valor cero Los coeficienb2 describen coacutemo los cambios en X 1 y X 2 afectan el valor de Y ˆ En el ejemplo del IRS pode

jar constante el nuacutemero de horas de trabajo de auditoriacutea de campo X 1 y cambiar el nuacutemerras en computadora X 2 Cuando hacemos esto el valor de Y ˆ aumenta en $1099000 por choras adicionales de tiempo en computadora Del mismo modo podemos fijar X 2 y encon

por cada aumento adicional de 100 horas en el nuacutemero de horas de trabajo de auditoriacuteas deY ˆ aumenta $564000

a b 1 y b 2 son loscoeficientes de re-gresioacuten estimados

Interpretacioacuten de laestimacioacuten

Sugerencia si tiene problemas para vi-sualizar lo que hace en realidad la regre-sioacuten muacuteltiple piense en el capiacutetulo 12 yrecuerde que una recta de regresioacuten des-

cribe la relacioacuten entre dos variables En la regresioacuten muacutelti-ple el plano de regresioacuten como el que se ve en la paacuteginaanterior describe la relacioacuten entre tres variables Y X 1 y X 2El concepto del plano de regresioacuten adecuado es el mismo

que el de la recta de regresioacuten adecuada es decir el qnimiza la suma de los cuadrados de las distancias vles entre los puntos de los datos y el plano en este cavez sea uacutetil recordar que cada variable independienteser responsable de cierta variacioacuten en la variable diente La regresioacuten muacuteltiple es soacutelo una manera dvarias variables independientes para hacer un promejor de la variable dependiente

SUGERENCIAS

Y

SUPOSICIONES

Valores para ajustarel plano de miacutenimoscuadrados donden ϭ 10

Tabla 13-2 Y X 1 X 2 X 1Y X 2Y X 1Y 2 X 2

1 X 2

2

(1) (2) (3) (2) ϫ (1) (3) ϫ (1) (2) ϫ (3) (2)2 (3)2

29 45 16 1305 464 720 2025 256

24 42 14 1008 336 588 1764 196

27 44 15 1188 405 660 1936 225

25 45 13 1125 325 585 2025 169

26 43 13 1118 338 559 1849 169

28 46 14 1288 392 644 2116 196

30 44 16 1320 480 704 1936 256

28 45 16 1260 448 720 2025 256 28 44 15 1232 420 660 1936 225

27 43 15 1161 405 645 1849 225

272 441 147 12005 4013 6485 19461 2173 7uarr uarr uarr uarr uarr uarr uarr uarr

Y X 1 X 2 X 1Y X 2Y X 1X 2 X 21 X 22

Y ෆ ϭ 272

X ෆ1 ϭ 441

X ෆ2 ϭ 147

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 756

Ejercicios 132

Ejercicios de autoevaluacioacutenEA 13-1 Dado el siguiente conjunto de datos

a) Calcule el plano de regresioacuten muacuteltipleb) Prediga Y cuando X 1 ϭ 30 y X 2 ϭ 27

Y X 1 X 2

25 35 50

30 67 4211 15 85

22 03 14

27 46 36

19 20 13

EA 13-2 Se ha reunido la siguiente informacioacuten de una muestra aleatoria de arrendadores de departamentos en uciudad Se intenta predecir la renta (en doacutelares por mes) con base en el tamantildeo del departamento (nuacutemro de habitaciones) y la distancia al centro de la ciudad (en millas)

Renta Nuacutemero de Distancia(doacutelares) habitaciones al centro

360 2 1

1000 6 1450 3 2

525 4 3

350 2 10

300 1 4

a) Calcule la ecuacioacuten de miacutenimos cuadrados que relacione mejor estas tres variablesb) Si alguien busca un departamento de dos habitaciones a 2 millas del centro iquestqueacute renta debe esperar pag

Conceptos baacutesicos 13-7 Dado el siguiente conjunto de datos

a) Calcule el plano de regresioacuten muacuteltipleb) Pronostique Y cuando X 1 ϭ 105 y X 2 ϭ 136

Y X 1 X 2

114 45 132

166 87 187

205 126 198

294 197 254

76 29 228

138 67 178

285 174 146

13-8 Para el siguiente conjunto de datosa) Calcule el plano de regresioacuten muacuteltipleb) Prediga Y cuando X 1 ϭ 28 y X 2 ϭ 10

Y X 1 X 2

10 8 4

17 21 9

18 14 11

26 17 20

35 36 13

8 9 28

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 856

13-9 Dado el siguiente conjunto de datosa) Calcule el plano de regresioacuten muacuteltipleb) Pronostique Y cuando X 1 ϭ Ϫ1 y X 2 ϭ 4

Y X 1 X 2

6 1 3

10 3 Ϫ1

9 2 4

14 Ϫ2 7

7 3 2

5 6 Ϫ4

Aplicaciones

13-10 Sam Spade duentildeo y gerente general de Stationery Store estaacute preocupado por el comportamienventas de un modelo de reproductor de CD y casetes que se venden en la tienda Se da cuenta de ten muchos factores que podriacutean ayudar a explicarlo pero cree que la publicidad y el precio soncipales determinantes Sam reunioacute los siguientes datos

Ventas Publicidad Precio(unidades vend) (nuacutem de anuncios) (doacutelares)

33 3 125

61 6 115

70 10 140

82 13 130

17 9 145

24 6 140

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir las ventas a partir de la publicidad y b) Si la publicidad es 7 y el precio es $132 iquestqueacute ventas podriacutea pronosticar

13-11 Un productor de comida para cerdos desea determinar queacute relacioacuten existe entre la edad de un cerdo empieza a recibir un complemento alimenticio de reciente creacioacuten el peso inicial del anima

mento de peso en un periodo de una semana con el complemento alimenticio La siguiente infoes resultado de un estudio de ocho lechones

X 1 X 2 Y

Nuacutemero Peso inicial Edad inicial Aumentode lechoacuten (libras) (semanas) de peso

1 39 8 7

2 52 6 6

3 49 7 8

4 46 12 10

5 61 9 9

6 35 6 5

7 25 7 38 55 4 4

a) Calcule la ecuacioacuten de miacutenimos cuadrados que mejor describa estas tres variablesb) iquestCuaacutento podemos esperar que un cerdo aumente de peso en una semana con el complemento

ticio si teniacutea nueve semanas de edad y pesaba 48 libras 13-12 Una estudiante graduada que quiere comprar un auto Neptune usado investigoacute los precios Pien

antildeo del modelo y el nuacutemero de millas recorridas influyen en el precio de compra Los datos siguirresponden a 10 autos con precio (Y ) en miles de doacutelares antildeo ( X 1) y millas recorridas ( X 2) en ma) Encuentre (calcule) la ecuacioacuten de miacutenimos cuadrados que mejor relacione estas tres variabb) La estudiante desea comprar un Neptune 1991 con alrededor de 40000 millas recorridas

pronostica que pagaraacute

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 956

(Y ) X 2

Precio X 1 Millas(miles de doacutelares) Antildeo (miles)

299 1987 556

602 1992 184

887 1993 213

392 1988 469

955 1994 118

905 1991 364

937 1992 282

42 1988 44248 1989 349

574 1991 264

13-13 La Reserva Federal de Estados Unidos realiza un estudio preliminar para determinar la relacioacuten etos indicadores econoacutemicos y el cambio porcentual anual en el producto interno bruto (PIB) Dindicadores examinados son el monto del deacuteficit del gobierno federal (en miles de millones de del promedio industrial Dow Jones (el valor medio del antildeo) Los datos correspondientes a seis antilde

Y X 1 X 2

Cambio en el PIB Deacuteficit federal Dow Jones

25 100 2850

Ϫ10 400 2100

40 120 330010 200 2400

15 180 2550

30 80 2700

a) Encuentre (calcule) la ecuacioacuten de miacutenimos cuadrados que mejor describa los datosb) iquestQueacute porcentaje de cambio en el PIB se esperariacutea en un antildeo en el cual el deacuteficit federal fue

millones de doacutelares y el promedio Dow Jones fue 3000

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-1 a) Y X 1 X 2 X 1Y X 2Y X 1X 2 X 2

1 X 2

2

25 35 50 875 1250 175 1225 2500

30 67 42 2010 1260 2814 4489 1764

11 15 85 165 935 1275 225 7225

22 03 14 66 308 042 009 196

27 46 36 1242 972 1656 2116 1296

19 20 13 380 247 260 400 169

1 ෆ3 ෆ4 ෆ 1 ෆ8 ෆ ෆ6 ෆ 2 ෆ4 ෆ ෆ0 ෆ 4 ෆ7 ෆ3 ෆ ෆ8 ෆ 4 ෆ9 ෆ7 ෆ ෆ2 ෆ 7 ෆ7 ෆ ෆ9 ෆ7 ෆ 8 ෆ4 ෆ ෆ6 ෆ4 ෆ 1 ෆ3 ෆ1 ෆ ෆ5 ෆ0 ෆ

Las ecuaciones 13-2 13-3 y 13-4 se convierten en

Y ϭ na ϩ b1 X 1 ϩ b2 X 2 134 ϭ 6 a ϩ 186b1 ϩ 240 b2

X 1Y ϭ a X 1 ϩ b1 X 21 ϩb2 X 1 X 2 4738 ϭ 186a ϩ 8464b1 ϩ 7797b2

X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22 4972 ϭ 240a ϩ 7797b1 ϩ 13150b2

Al resolver estas ecuaciones de manera simultaacutenea se obtiene

a ϭ 203916 b1 ϭ 23403 b2 ϭ Ϫ13283

De modo que la ecuacioacuten de regresioacuten es Y ˆ ϭ 203916 ϩ 23403 X 1 Ϫ 13283 X 2b) Con X 1 ϭ 30 y X 2 ϭ 27

Y ˆ = 203916 ϩ 23403(30) Ϫ 13283(27) ϭ 2883

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1056

EA 13-2 a) En este problema Y ϭ renta X 1 ϭ nuacutemero de habitaciones X 2 ϭ distancia al centro

Y X 1 X 2 X 1Y X 2Y X 1X 2 X 2

1 X 2

2 Y 2

360 2 1 720 360 2 4 1 129600

1000 6 1 600 1000 6 36 1 1000000

450 3 2 1350 900 6 9 4 202500

525 4 3 2100 1575 12 16 9 272625

350 2 10 700 3500 20 4 100 122500

300 1 4 300 1200 4 1 16 90000

2985 18 21 11170 8535 50 70 131 1820225

Las ecuaciones 13-2 13-3 y 13-4 se convierten en

Y ϭ na ϩ b1 X 1 ϩb2 X 2 2985 ϭ 6a ϩ 18b1 ϩ 21b2

X 1Y ϭ a X 1 ϩ b1 X 21 ϩb2 X 1 X 2 11170 ϭ 18a ϩ 70b1 ϩ 50b2

X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22 8535 ϭ 21a ϩ 50b1 ϩ 131b2

Al resolver estas ecuaciones simultaacuteneas se obtiene

a ϭ 964581 b1 ϭ 1364847 b2 ϭ Ϫ24035

De manera que la ecuacioacuten de regresioacuten es

Y ˆ ϭ 964581 ϩ 1364847 X 1 Ϫ 24035 X 2

b) Cuando el nuacutemero de habitaciones ϭ 2 y la distancia al centro ϭ 2

Y ˆ ϭ 964581 ϩ 1364847(2) Ϫ 24035(2) ϭ $365

133 La computadora y la regresioacutenmuacuteltiple

En el capiacutetulo 12 y hasta donde vamos de eacuteste hemos presentado problemas simplificados y muestrasde tamantildeo pequentildeo Despueacutes del ejemplo de la seccioacuten anterior probablemente usted haya llegadoa la conclusioacuten de que no estaacute interesado en la regresioacuten si tiene que hacer los caacutelculos a mano Dehecho conforme aumenta el tamantildeo de las muestras y crece el nuacutemero de variables independientespara la regresioacuten hacer los caacutelculos incluso con la ayuda de una calculadora de bolsillo se convier-te en algo muy inconveniente

Sin embargo como administradores debemos manejar problemas complejos que requieren mues-tras maacutes grandes y variables independientes adicionales Como ayuda para resolver estos problemasmaacutes detallados utilizaremos una computadora que nos permitiraacute realizar un gran nuacutemero de caacutelcu-los en poco tiempo

Suponga que tenemos no una ni dos variables independientes sino un nuacutemero k de ellas X 1

X 2 X k Como antes sea n el nuacutemero de datos que se tienen La ecuacioacuten de regresioacuten que inten-tamos estimar es

Inconvenienciadel caacutelculo deregresiones a mano

Ecuacioacuten de estimacioacuten de regresioacuten muacuteltiple

Y ˆ ϭ

b1 X 1ϩ

b2 X 2ϩ ϩ

bk X k [13-5]

Ahora veremos coacutemo podemos utilizar una computadora para estimar los coeficientes de regresioacutenPara demostrar coacutemo una computadora maneja el anaacutelisis de regresioacuten muacuteltiple tomemos el pro-

blema del Servicio Interno de Contribuciones (IRS) de la seccioacuten anterior Suponga que el departa-mento de auditoriacuteas agrega a su modelo la informacioacuten correspondiente a las recompensas para losinformantes La dependencia desea incluir esta tercera variable independiente X 3 debido a que sien-

Demostracioacuten de laregresioacuten muacuteltipleen la computadora

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1156

te que existe cierta relacioacuten entre estas recompensas y el descubrimiento de impuestos no pEn la tabla 13-3 se registroacute la informacioacuten de los uacuteltimos 10 meses

Para resolver este problema la divisioacuten de auditoriacutea usoacute el procedimiento de regresioacutende Minitab Por supuesto todaviacutea no sabemos coacutemo interpretar la solucioacuten que proporciocomo veremos la mayor parte de los nuacutemeros dados en la solucioacuten corresponden muy de c

los estudiados en el contexto de regresioacuten simple

Salida de Minitab

Una vez que se introducen los datos y se eligen las variables dependiente e independientescalcula los coeficientes de regresioacuten y varios estadiacutesticos asociados con la ecuacioacuten de regrveraacute la salida del programa para el problema del IRS La figura 13-2 da la primera parte de la

1 La ecuacioacuten de regresioacuten De los nuacutemeros dados en la columna Coef se puede leercioacuten de estimacioacuten

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ b3 X 3

ϭ Ϫ45796 ϩ 0597 X 1 ϩ 1177 X 2 ϩ 0405 X 3

Podemos interpretar esta ecuacioacuten en una forma similar a la de la ecuacioacuten de regresioacutevariables en la paacutegina 558 Si se mantienen constantes el nuacutemero de horas de audicampo X 1 y el nuacutemero de horas de computadora X 2 y se cambian las recompeninformantes X 3 entonces el valor de Y ˆ aumentaraacute $405000 por cada $1000 pagadosformantes De igual manera al mantener X 1 y X 3 constantes se ve que por cada 1adicionales de tiempo de computadora Y ˆ aumentaraacute $1177000 Por uacuteltimo si se dej

Buacutesqueda e interpre-tacioacuten de la ecuacioacutende regresioacuten

Salida del programaMinitab

Uso de Minitab pararesolver problemasde regresioacuten muacuteltiple

Factores relacionadoscon el descubrimientode impuestos nopagados

Tabla 13-3 Horas en Impueauditoriacuteas Horas Recompensa pagde campo en computadora a informantes descub(cientos) (cientos) (miles) (mill

Mes X 1 X 2 X 3

Enero 45 16 71 2

Febrero 42 14 70 2

Marzo 44 15 72 2

Abril 45 13 71 2

Mayo 43 13 75 2

Junio 46 14 74 2

Julio 44 16 76 3

Agosto 45 16 69 2

Septiembre 44 15 74 2

Octubre 43 15 73 2

FIGURA 13-2

Salida de Minitabpara la regresioacuten

del ServicioInterno deContribuciones

Anaacutel i s i s de r e gr e s i oacuten

La ec ua ci oacuten de r egr es i oacuten es

DESCUBRE ϭ mdash45 0 ϩ 0 597 AUDI T ϩ 1 18 COMPUTADORA ϩ 0 405 RECOMPENS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e Ϫ45 796 4 878 Ϫ9 39 0 000AUDI T 0 50697 0 08112 7 36 0 000COMPUTADORA 1 17684 0 08407 14 00 0 000RECOMPENSA 0 40511 0 04223 9 59 0 000

s ϭ 0 2861 R- s q ϭ 98 3

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1256

tantes X 2 y X 3 se estima que 100 horas adicionales dedicadas a auditoriacuteas de campo descubri-raacuten $597000 adicionales de impuestos no pagados Observe que se redondearon los valoresproporcionados por la regresioacuten dada por Minitab (figura 13-2)

Suponga que en noviembre el IRS intenta dejar las horas de trabajo en auditoriacuteas de cam-po y las horas en computadora en sus niveles de octubre (4300 y 1500) pero decide aumen-tar las recompensas pagadas a los informantes a $75000 iquestCuaacutento de impuestos no pagadosesperan descubrir en noviembre Sustituyendo estos valores en la ecuacioacuten de regresioacuten esti-mada obtenemos

Y ˆ ϭ Ϫ45796 ϩ 0597 X 1 ϩ 1177 X 2 ϩ 0405 X 3

Y ˆ ϭ Ϫ45796 ϩ 0597(43) ϩ 1177(15) ϩ 0405(75)

Y ˆ ϭ Ϫ45796 ϩ 25671 ϩ 17655 ϩ 30375

Y ˆ ϭ 27905 larr Descubrimientos estimados $27905000

De modo que el departamento de auditoriacuteas espera descubrir aproximadamente $28 millonesde evasioacuten de impuestos en noviembre

2 Una medida de dispersioacuten el error estaacutendar de la estimacioacuten de la regresioacuten muacuteltiple Ya quehemos determinado la ecuacioacuten que relaciona a nuestras tres variables necesitamos una me-dida de la dispersioacuten alrededor de este plano de regresioacuten muacuteltiple En la regresioacuten simple laestimacioacuten es maacutes precisa conforme el grado de dispersioacuten alrededor de la regresioacuten es menorLo mismo es cierto para los puntos de la muestra que se encuentran alrededor del plano de re-gresioacuten muacuteltiple Para medir esta variacioacuten debemos utilizar de nuevo la medida conocida co-

mo error estaacutendar de la estimacioacuten

Medicioacuten de ladispersioacuten alrededordel plano de regre-sioacuten muacuteltiple usodel error estaacutendar dela estimacioacuten

Error estaacutendar de la estimacioacuten

se ϭ Ί [13-6]Y ndash Y ˆ )2ᎏᎏ

n Ϫ k Ϫ 1

donde

bull Y ϭ valores muestrales de la variable dependientebull Y ˆ ϭ valores correspondientes estimados con la ecuacioacuten de regresioacutenbull n ϭ nuacutemero de puntos de la muestrabull k ϭ nuacutemero de variables independientes (ϭ 3 en nuestro ejemplo)

El denominador de esta ecuacioacuten indica que en la regresioacuten muacuteltiple con k variables in-

dependientes el error estaacutendar tiene n Ϫ k Ϫ 1 grados de libertad Esto se debe a que los

grados de libertad se reducen de n en k ϩ 1 constantes numeacutericas a b1 b2 hellip b k que se

estimaron a partir de la misma muestra

Para calcular se observamos los errores individuales (Y Ϫ Y ˆ ) en el plano de regresioacuten ajus-tado los elevamos al cuadrado calculamos su media (dividiendo entre n Ϫ k Ϫ 1 en lugar den) y tomamos la raiacutez cuadrada del resultado Debido a la forma en que se calcula se se cono-ce a veces como raiacutez del error cuadraacutetico medio [o raiacutez de mse (mean-square error)] De lasalida de Minitab que usa s en lugar de se para denotar el error estaacutendar vemos que la raiacutez demse en el problema del Servicio Interno de Contribuciones es 0286 es decir $286000

Como en el caso de la regresioacuten simple podemos utilizar el error estaacutendar de la estimacioacuteny la distribucioacuten t para formar un intervalo de confianza alrededor de nuestro valor estimadoY ˆ En el problema de la evasioacuten de impuestospara 4300 horas de trabajo en auditoriacuteas de cam-po 1500 horas en computadora y $75000 de pago a informantes Y ˆ es $27905000 como es-timacioacuten de impuestos no pagados descubiertos y se es $286000 Si deseamos construir unintervalo de confianza del 95 alrededor de esta estimacioacuten de $27905000 miramos enla tabla 2 del apeacutendice en la columna del 5 y localizamos ahiacute el rengloacuten correspondiente a

Intervalos deconfianza para Y ˆ

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1356

n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad El valor apropiado de t para nuestracioacuten del intervalo es de 2447 En consecuencia podemos calcular los liacutemites de nutervalo de confianza como sigue

Y ˆ ϩ t (se) ϭ 27905000 ϩ (2447)(286000)

Y ˆ ϩ t(se) ϭ 27905000 ϩ 699800

Y ˆ ϩ t(se) ϭ 28604800 larr Liacutemite superior

Y ˆ Ϫ t (se) ϭ 27905000 Ϫ (2447)(286000)

Y ˆ ϩ t(se) ϭ 27905000 ndash 699800

Y ˆ ϩ t(se) ϭ 27205200 larr Liacutemite inferior

Con un nivel de confianza del 95 el departamento de auditoriacuteas puede sentirse sque los descubrimientos reales estaraacuten en este intervalo que va de $27205200 a $28Si el IRS desea usar un nivel de confianza menor como 90 puede reducir el intevalores para la estimacioacuten de descubrimientos de impuestos no pagados Igual que cgresioacuten simple podemos utilizar la distribucioacuten normal estaacutendar (tabla 1 del apeacutendaproximar la distribucioacuten t siempre que los grados de libertad (n menos el nuacutemero cientes de regresioacuten estimados) sea un nuacutemero mayor que 30

Al antildeadir la tercera variable independiente (recompensas a informantes) iquestmejoroacuteregresioacuten Como se mide la dispersioacuten de los datos alrededor del plano de regresioacutenmenores de se deberiacutean indicar mejores regresiones Para la regresioacuten de dos variablecimos con anterioridad en este mismo capiacutetulo se resultoacute ser 1076 Como al agregarra variable se se redujo a 0286 vemos que siacute mejoroacute el ajuste de la regresioacuten en este Sin embargo en general no es cierto que al agregar variables siempre se reduzc

3 El coeficiente de determinacioacuten muacuteltiple Al estudiar el anaacutelisis de correlacioacuten simpmos la fuerza de la relacioacuten entre dos variables utilizando el coeficiente de determinla muestra r 2 Este coeficiente de determinacioacuten es la fraccioacuten de la variacioacuten total riable dependiente Y que se explica con la ecuacioacuten de estimacioacuten

Similarmente en la correlacioacuten muacuteltiple mediremos la fuerza de la relacioacuten entre trbles utilizando el coeficiente de determinacioacuten muacuteltiple R

2 o su raiacutez cuadrada R (el cte de correlacioacuten muacuteltiple) Este coeficiente de determinacioacuten muacuteltiple es tambieacuten la

que representa la porcioacuten de la variacioacuten total de Y que ldquoexplicardquo el plano de regr

Note que la salida del programa da el valor 983 para R2 Esto nos dice que las tr

bles independientes explican el 983 de la variacioacuten total de impuestos no pagadobiertos Para la regresioacuten de dos variables hecha antes R2 es soacutelo 0729 asiacute que las trabajo en auditoriacutea de campo y las horas en computadora explican el 729 de la vaagregar las recompensas a los informantes explica el 254 restante de la variacioacuten

Todaviacutea no hemos explicado los nuacutemeros en las columnas etiquetadas con Desvciente t y p de la figura 13-2 Estos nuacutemeros se utilizaraacuten para hacer inferencias acercano de regresioacuten de la poblacioacuten tema que se trataraacute en la seccioacuten 13-4

Uso del coeficientede determinacioacutenmuacuteltiple

Valor de variablesadicionales

Interpretacioacuten delintervalo deconfianza

Ya nadie calcula regresiones a mano hayotras cosas maacutes interesantes en queacute ocu-par nuestro tiempo Se explicoacute la teacutecnicacalculando las soluciones a mano para

que no tenga que pensar en su computadora como en unaldquocaja negrardquo que hace muchas cosas uacutetiles que no puedeexplicar Sugerencia el valor real de usar la computadorapara calcular regresiones muacuteltiples es que puede manejarmuchas variables independientes y obtener una mejor ecua-

cioacuten de estimacioacuten que puede medir si agregar otrble independiente realmente mejora los resultados yposible observar con rapidez el comportamiento de

indica la proporcioacuten de la variacioacuten total de la variapendiente que se explica con las variables indepenLa computadora hace todo el trabajo tedioso mdashsin semdash y le deja tiempo para el trabajo maacutes importcomprender los resultados y usarlos para tomar mdecisiones

SUGERENCIASY

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1456

La ec uac i oacuten de r egr es i oacuten esY = - 12 75 + 17 1 X1 + 0 54 1 X2 - 0 17 4 X3

Pr onos t i c ador Coe f De s vEs t Coc i e nt e - t pCons t a n t e - 1275 2699 - 0 47 0 719X1 17 059 6 908 2 47 0 245X2 0 5406 0 3144 1 72 0 335X3 - 0 1743 0 1005 - 1 73 0 333

s = 396 1 R- s q = 87 2

b) iquestQueacute porcentaje de la variacioacuten total del nuacutemero de solicitudes urgentes de devolucioacuten de impuestosexplica esta ecuacioacuten

c) Para este antildeo el iacutendice econoacutemico es 169 la poblacioacuten residente en un radio de una milla desde la

oficina es 10212 habitantes y el ingreso promedio en Ithaca es $26925 iquestCuaacutentas solicitudes urgen-tes de devolucioacuten de impuestos debe Pam esperar procesar entre el 1 de marzo y el 15 de abril

Conceptos baacutesicos 13-14 Dado el siguiente conjunto de datos utilice el paquete de software que tenga disponible para encontrar la

ecuacioacuten de regresioacuten de mejor ajuste y responda a lo siguientea) iquestCuaacutel es la ecuacioacuten de regresioacutenb) iquestCuaacutel es el error estaacutendar de la estimacioacutenc) iquestCuaacutel es el valor de R

2 para esta regresioacutend) iquestCuaacutel es el valor pronosticado para Y cuando X 1 ϭ 58 X 2 ϭ 42 y X 3 ϭ 51

Y X 1 X 2 X 3

647 35 53 85809 74 16 26246 25 63 45439 37 94 88777 55 14 36206 83 92 25669 67 25 27343 12 22 13

Ejercicios 133

Ejercicios de autoevaluacioacuten

EA 13-3 Pam Schneider posee y opera un despacho de contadores en Ithaca Nueva York Ella piensa que seriacutea uacutetilpredecir el nuacutemero de solicitudes urgentes de devolucioacuten de impuestos que le pediraacuten durante el ajetrea-do periodo del 1 de marzo al 15 de abril para poder planear mejor sus necesidades de personal duranteesta eacutepoca Tiene la hipoacutetesis de que varios factores pueden ser uacutetiles para su pronoacutestico Los datos de es-tos factores y el nuacutemero de solicitudes urgentes de devolucioacuten de impuestos de antildeos pasados son

Y X 2 Nuacutemero de

Poblacioacuten solicitudesresidente X 3 de devolucioacuten

X 1 en un radio Ingreso urgentesIacutendice de una milla promedio (1 de marzo

econoacutemico desde la oficina en Ithaca a 15 de abril)

99 10188 21465 2306106 8566 22228 1266100 10557 27665 1422129 10219 25200 1721179 9662 26300 2544

a) Use el siguiente resultado de Minitab para determinar la ecuacioacuten de regresioacuten maacutes adecuada para es-

tos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1556

13-15 Dado el siguiente conjunto de datos utilice el paquete de software que tenga a su disposicioacuten patrar la ecuacioacuten de regresioacuten de mejor ajuste y responda a lo siguientea) iquestCuaacutel es la ecuacioacuten de regresioacutenb) iquestCuaacutel es el error estaacutendar de la estimacioacutenc) iquestCuaacutel es el valor de R2 para esta regresioacutend) Deacute un intervalo de confianza para la estimacioacuten del 95 para el valor Y cuando los valores X

y X 4 son 524 416 358 y 3 respectivamente

X 1 X 2 X 3 X 4 Y

214 629 219 Ϫ2 228

517 407 429 5 937418 818 698 2 649

118 410 909 Ϫ4 192

716 226 129 8 558

919 615 309 1 231

Aplicaciones

1316 Las estaciones de policiacutea en Estados Unidos estaacuten interesadas en predecir el nuacutemero de arrestodos que deberaacuten procesar cada mes para programar mejor a los empleados de oficina En los daricos el nuacutemero promedio de arrestos (Y ) cada mes tiene influencia del nuacutemero de oficiales en

policiaca ( X 1) la poblacioacuten de la ciudad en miles ( X 2) y el porcentaje de personas desempleadasdad en miles ( X 3) Los datos de estos factores en 15 ciudades se presentan en la tablaa) Utilice el paquete de software que tenga disponible para determinar la ecuacioacuten de regresioacuten

jor se ajuste a estos datosb) iquestQueacute porcentaje de la variacioacuten total en el nuacutemero de arrestos (Y ) explica esta ecuacioacutenc) El departamento de policiacutea de ChapelBoro desea pronosticar el nuacutemero de arrestos mensua

pelBoro tiene una poblacioacuten de 75000 habitantes 82 elementos en su fuerza policiaca y utaje de desempleo del 105 iquestCuaacutentos arrestos pronostica para cada mes

Nuacutemero promedio Nuacutemero de oficiales Tamantildeo de la ciudad (X 2) Porcende arrestos mensuales (Y ) en la fuerza (X 1) en miles de habitantes desemp

3906 68 816 4

5043 94 751 3

6284 125 973 5

7456 175 1235 8

5852 113 1184 11

4503 82 654 9

3278 46 616 12

2605 32 543 18

4775 89 974 4

3898 67 824 6

3124 47 564 8

3675 59 713 7

3744 61 674 9

4946 87 963 11

4875 92 864 4

13-17 Estamos intentando predecir la demanda anual (DEMAND) de cierto producto utilizando las svariables independientes

PRECIO ϭ precio del producto (en doacutelares)

INGRESO ϭ ingreso del consumidor (en doacutelares)

SUB ϭ precio de un bien sustituto (en doacutelares)

( Nota Un bien sustituto es aquel que puede suplir a otro bien Por ejemplo la margarina es untituto de la mantequilla)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1656

Se recolectaron datos correspondientes al periodo 1982-1996

Antildeo Demanda Precio ($) Ingreso ($) Sub ($)

1982 40 9 400 101983 45 8 500 141984 50 9 600 121985 55 8 700 131986 60 7 800 111987 70 6 900 151988 65 6 1000 161989 65 8 1100 17

1990 75 5 1200 221991 75 5 1300 191992 80 5 1400 201993 100 3 1500 231994 90 4 1600 181995 95 3 1700 241996 85 4 1800 21

a) Utilice el paquete de software que tenga disponible para encontrar la ecuacioacuten de regresioacuten ajuste para estos datos

b) iquestSon los signos (ϩ o Ϫ) de los coeficientes de regresioacuten de las variables independientes los qperan Deacute una explicacioacuten breve ( Nota Eacutesta no es una pregunta estadiacutestica soacutelo necesita pesignifican los coeficientes de regresioacuten)

c) Establezca e interprete el coeficiente de determinacioacuten muacuteltiple del problemad) Establezca e interprete el error estaacutendar de la estimacioacuten para el problemae) Seguacuten la ecuacioacuten de regresioacuten obtenida iquestqueacute valor de DEMAND predeciriacutea si el precio de

ductos fue $6 el ingreso del consumidor $1200 y el precio del bien sustituto $17 13-18 Bill Buxton profesor de estadiacutestica de una prominente escuela de administracioacuten tiene un prof

tereacutes en los factores que afectan el desempentildeo de los estudiantes en los exaacutemenes El examen psemestre anterior tuvo una distribucioacuten de calificaciones amplia pero Bill tiene la certeza de qfactores explican esa distribucioacuten permite a sus estudiantes que estudien en tantos libros comoca el coeficiente de inteligencia de los estudiantes variacutea tienen distintas edades y difieren losque dedican a estudiar Con el propoacutesito de desarrollar una foacutermula de prediccioacuten para las califde los exaacutemenes Bill pidioacute a cada estudiante que respondiera al final del examen preguntas refe

tiempo de estudio y nuacutemero de libros utilizados Los registros que teniacutea Bill ya incluiacutean el coefiinteligencia y la edad de modo que reunioacute los datos del grupo y corrioacute la regresioacuten muacuteltiple deLa salida de la corrida de Bill fue la siguiente

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t Con s t a nt e minus49 948 41 55 minus1 20 0HORAS 1 06931 0 98163 1 09 0CI 1 36460 0 37627 3 63 0LI BROS 2 03982 1 50799 1 35 0EDAD minus1 79890 0 67332 minus2 67 0

s = 11 657 R- s q = 76 7

a) iquestCuaacutel es la ecuacioacuten de regresioacuten de mejor ajuste para estos datos

b) iquestQueacute porcentaje de la variacioacuten en las calificaciones se explica con esta ecuacioacutenc) iquestQueacute calificacioacuten esperariacutea usted para un estudiante de 21 antildeos de edad con un coeficiente gencia (CI) de 113 que estudioacute durante cinco horas y utilizoacute tres libros diferentes

13-19 La compantildeiacutea de tiendas de abarrotes Twenty-Two estaacute planeando expandir su cadena Como ayudleccionar los lugares donde abriraacute las nuevas tiendas recolectoacute datos de las ventas semanales de casus 23 tiendas Para explicar la variabilidad de las ventas semanales tambieacuten reunioacute informacioacutencribe cuatro variables que se cree estaacuten relacionadas con las ventas Las variables se definen como

VENTAS ϭ ventas semanales promedio en cada tienda en miles de doacutelares

AUTOS ϭ volumen promedio de traacutensito de automoacuteviles por semana en miles de autos

ENTRADA ϭ facilidad de entradasalida medida en una escala de 1 a 100

INGANUAL ϭ ingreso anual promedio por familia en el aacuterea en miles de doacutelares

DISTANCIA ϭ distancia en millas desde la tienda al supermercado maacutes cercano

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1756

Los datos se analizaron con Minitab y la salida es la siguiente

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t Cons t a nt e 175 37 92 62 1 89 0 0AUTOS - 0 028 0 315 minus0 09 0 9ENTRADA 3 775 1 272 2 97 0 0I NGANUAL 1 990 4 510 0 44 0 6DI STANCI A 212 41 28 090 7 56 0 0

s = 85 587 R- s q = 95 8

a) iquestCuaacutel es la ecuacioacuten de regresioacuten de mejor ajuste dada por Minitab

b) iquestCuaacutel es el error estaacutendar de la estimacioacuten para esta ecuacioacutenc) iquestQueacute fraccioacuten de la variacioacuten en las ventas se explica con esta regresioacutend) iquestQueacute ventas predeciriacutea para una tienda localizada en un vecindario que tuvo un ingreso anu

milia de $20000 estaba a 2 millas del supermercado maacutes cercano se encontraba en una calvolumen promedio semanal de traacutensito de 100000 autos y con una facilidad de entrada de

13-20 Rick Blackburn estaacute pensando en vender su casa Con el fin de decidir el precio que pediraacute poreunido datos de 12 ventas recientes Registroacute el precio de venta (en miles de doacutelares) el nuacutemercuadrados de construccioacuten (en cientos de pies cuadrados) el nuacutemero de pisos el nuacutemero de bantiguumledad de la casa (en antildeos)

Precio de venta Pies cuad Pisos Bantildeos Antiguumledad

4965 89 1 10 2

6795 95 1 10 68115 126 2 15 11

8160 129 2 15 8

9150 190 2 10 22

9525 176 1 10 17

10035 200 2 15 12

10425 206 2 15 11

11265 205 1 20 9

14970 251 2 20 8

16065 227 2 20 18

23250 408 3 40 12

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de

de mejor ajuste para los datosb) iquestCuaacutel es el valor de R2 para esta ecuacioacutenc) Si la casa de Rick tiene 1800 pies cuadrados (ϭ 180 cientos de pies cuadrados) un piso

y seis antildeos de antiguumledad iquestqueacute precio de venta puede esperar Rick 13-21 La Allegheny Steel Corporation ha estado buscando los factores que influyen en la cantidad de

millones de toneladas) que puede vender cada antildeo La administracioacuten sospecha que los siguientfactores principales la tasa anual de inflacioacuten del paiacutes el precio promedio por tonelada del acetado que acota los precios (en doacutelares) de Allegheny y el nuacutemero de automoacuteviles (en millonesfabricantes de autos de Estados Unidos planean producir ese antildeo Se recolectaron los datos de losiete antildeos

Y X 2 X 3

Millones X 1 Cota de Nuacutemero

de tons Tasa de importa- deAntildeo vendidas inflacioacuten ciones automoacuteviles

1993 42 31 310 62

1992 31 39 500 51

1991 40 75 220 57

1990 47 107 450 71

1989 43 155 435 65

1988 37 130 260 61

1987 35 110 305 59

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1856

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de regresioacutende mejor ajuste para los datos

b) iquestQueacute porcentaje de la variacioacuten total de la cantidad de acero vendido (en millones de toneladas) porAllegheny cada antildeo explica esta ecuacioacuten

c) iquestCuaacutentas toneladas de acero deberaacute esperar Allegheny vender en un antildeo en el que la tasa de inflacioacutenes 71 los fabricantes de automoacuteviles norteamericanos planean producir 60 millones de autos y la co-ta promedio del acero importado por tonelada es $350

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-3 De la salida del paquete de software se obtienen los siguientes resultadosa) Y ˆ ϭ Ϫ1275 ϩ 17059 X 1 ϩ 05406 X 2 Ϫ 01743 X 3b) R

2ϭ 872 el modelo explica el 872 de la variacioacuten total en Y

c) Y ˆ ϭ Ϫ1275 ϩ 17059(169) ϩ 05406(10212) Ϫ 01743(26925) ϭ 2436 reembolsos de impuestos

134 Inferencias sobre paraacutemetrosde poblacioacuten

En el capiacutetulo 12 se vio que la recta de regresioacuten de la muestra Y ˆ ϭ a ϩ bX (ecuacioacuten 12-3) esti-maba la recta de regresioacuten de la poblacioacuten Y ϭ A ϩ BX (ecuacioacuten 12-13) La razoacuten por la cual soacute-lo podiacuteamos estimar la recta de regresioacuten de poblacioacuten y no determinarla con exactitud era que los

puntos no caen exactamente en la recta de regresioacuten de la poblacioacuten Debido a las variaciones alea-torias los puntos satisfaciacutean Y ϭ A ϩ BX ϩ e (ecuacioacuten 12-13a) maacutes que a Y ϭ A ϩ BX

En la regresioacuten muacuteltiple se tiene justo la misma situacioacuten Nuestro plano de regresioacuten estimado

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k [13-5]

es una estimacioacuten de un plano de regresioacuten de poblacioacuten verdadero pero desconocido de la forma

Plano de regresioacutende la poblacioacuten

De nuevo los puntos individuales normalmente no caen con exactitud en el plano de regresioacuten depoblacioacuten Consideremos el problema del Servicio Interno de Contribuciones para ver por queacute Notodos los pagos a informantes tendraacuten la misma efectividad Algunas horas en computadora podriacuteanutilizarse para recolectar y organizar datos otras para analizar esos datos en busca de errores y frau-des El eacutexito de la computadora en descubrir impuestos no pagados puede depender de cuaacutento tiempose dedique a cada una de estas actividades Por eacutestas y otras razones algunos de los puntos se en-contraraacuten arriba del plano de regresioacuten y algunos estaraacuten abajo de eacuteste En lugar de satisfacer laecuacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

los puntos individuales satisfaraacuten la ecuacioacuten

Las variaciones alea-torias desplazan lospuntos del plano deregresioacuten

Ecuacioacuten de regresioacuten de la poblacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

Plano de regresioacuten de la poblacioacuten maacutes la variacioacuten aleatoria

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e [13-7a]

La cantidad e que aparece en la ecuacioacuten 13-7a es una variacioacuten aleatoria que en promedio es iguala cero La desviacioacuten estaacutendar de las variaciones individuales e y el error estaacutendar de la estima-cioacuten se que estudiamos en la seccioacuten anterior es una estimacioacuten de e

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1956

Como nuestro plano de regresioacuten de la muestra Y ˆ ϭ a ϩ b1X1 ϩ b2 X 2 ϩ ϩ bk X k (ecuaci13-7) estima el plano de regresioacuten de poblacioacuten desconocido Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk

(ecuacioacuten 13-7) deberemos ser capaces de usarlo para hacer inferencias sobre el plano de regreside la poblacioacuten En esta seccioacuten haremos inferencias acerca de las pendientes ( B1 B2 Bk ) deecuacioacuten de regresioacuten ldquoverdaderardquo (la que se aplica a la poblacioacuten completa) basadas en las pendietes (b1 b2 bk ) de la ecuacioacuten de regresioacuten estimada a partir de la muestra de datos

Inferencias acerca de una pendiente individual B i El plano de regresioacuten se deriva de una muestra y no de la poblacioacuten completa Como resultado

podemos esperar que la ecuacioacuten de regresioacuten verdadera Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k que se aplica a la poblacioacuten completa) sea exactamente igual que la ecuacioacuten estimada a partir observaciones de la muestra Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k Sin embargo podemos utilizarvalor de bi una de las pendientes que calculamos a partir de la muestra para probar hipoacutetesis acca del valor de Bi una de las pendientes del plano de regresioacuten para la poblacioacuten completa

El procedimiento para probar una hipoacutetesis respecto a Bi es parecido al procedimiento analizaen los capiacutetulos 8 y 9 sobre pruebas de hipoacutetesis Para entender este proceso regresemos al probma que relaciona los impuestos no pagados descubiertos con las horas de trabajo en auditoriacuteas campo horas en computadora y recompensas a informantes En la paacutegina 729 sentildealamos que b10597 El primer paso consiste en encontrar un valor para B1 y compararlo con b1 ϭ 0597

Suponga que durante un periodo largo la pendiente de la relacioacuten entre Y y X 1 fue 0400 Paprobar si todaviacutea es vaacutelida podriacuteamos definir las hipoacutetesis como

H0 B1 ϭ 0400 larr Hipoacutetesis nula

H1 B1 0400 larr Hipoacutetesis alternativa

De hecho realizamos la prueba para saber si los datos actuales indican que B1 ha cambiado su vahistoacuterico de 0400

Para encontrar el estadiacutestico de prueba para B1 es necesario hallar primero el error estaacutendar d

coeficiente de regresioacuten El coeficiente de regresioacuten con el que estamos trabajando es b1 de moque el error estaacutendar de este coeficiente se representa con sb1

Resulta demasiado difiacutecil calcular sb1 a mano pero por fortuna Minitab calcula los errores estaacutedar de todos los coeficientes de regresioacuten Por comodidad repetimos la figura 13-2 Los errores taacutendar de los coeficientes se dan en la columna DesvEst de la salida de Minitab

En el cuadro de salida vemos que sb1

es 00811 (Similarmente si deseamos probar una hipoacutesis acerca de B2 vemos que el error estaacutendar apropiado que debemos utilizar es sb2 ϭ 00841) Uvez que encontramos sb1 en la salida de Minitab podemos usar la ecuacioacuten 13-8 para estandarizarpendiente de nuestra ecuacioacuten de regresioacuten ajustada

Estandarizacioacutendel coeficiente deregresioacuten

Error estaacutendar delcoeficientede regresioacuten

Prueba de unahipoacutetesis acerca de B i

Diferencia entre la

ecuacioacuten de regre-sioacuten verdadera y unaestimada a partir delas observacionesde la muestra

Coeficiente de regresioacuten estandarizado

t ϭ [13-8bi ndash Bi0ᎏ

sbi

donde

bull biϭ pendiente de la regresioacuten ajustada

bull Bi0 ϭ pendiente real hipoteacutetica para la poblacioacutenbull sbi ϭ error estaacutendar del coeficiente de regresioacuten

iquestPor queacute utilizamos t para denotar el estadiacutestico estandarizado Recuerde que en la regresioacuten siple utilizamos a y b en la ecuacioacuten 12-7 para calcular se y que se estimaba e la desviacioacuten estaacutedar de las variaciones de los datos (ecuacioacuten 12-13a) Entonces utilizamos se en la ecuacioacuten 12-para encontrar sb el error estaacutendar del coeficiente de regresioacuten que corresponde a la pendiente E

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2056

pezamos con n puntos y los usamos para estimar los dos coeficientes a y b Luego basamtras pruebas en la distribucioacuten t con n Ϫ 2 grados de libertad

De manera similar en la regresioacuten muacuteltiple tambieacuten empezamos con n puntos pero lospara estimar k ϩ 1 coeficientes la ordenada a y k pendientes b1 b2 bk Despueacutes estcientes se usan en la ecuacioacuten 13-6 para calcular se que de nuevo es una estimacioacuten de eviacioacuten estaacutendar de las variaciones de los datos (ecuacioacuten 13-7a) Luego se utiliza se (en ucioacuten que estaacute maacutes allaacute del alcance de este libro) para encontrar s

bi Debido a lo anterior

nuestras pruebas de hipoacutetesis en la distribucioacuten t con n Ϫ k Ϫ 1 (ϭ n Ϫ ( k ϩ l)) grados de En nuestro ejemplo el valor estandarizado del coeficiente de regresioacuten es

t ϭ

ϭ

ϭ 2432 larr Coeficiente de regresioacuten estandarizado

Suponga que estamos interesados en probar nuestras hipoacutetesis al nivel de significancia

Como tenemos 10 observaciones en la muestra y tres variables independientes sabemos n Ϫ k Ϫ 1 o 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad Buscamos en la tabla 2 del apeacutendice en lana de 10 y el rengloacuten de 6 grados de libertad Ahiacute vemos que el valor apropiado de t es 19mo nos preocupa si b1 (la pendiente del plano de regresioacuten de la muestra) es significativamferente de B1 (la pendiente hipoteacutetica del plano de regresioacuten de la poblacioacuten) eacutesta es una pdos colas y los valores criacuteticos son Ϯ1943 El coeficiente de regresioacuten estandarizado es 2se encuentra fuera de la regioacuten de aceptacioacuten de nuestra prueba de hipoacutetesis Por consiguichazamos la hipoacutetesis nula de que B1 todaviacutea es igual a 0400 En otras palabras existe unacia suficientemente grande entre b1 y 0400 para concluir que B1 ha cambiado respecto a histoacuterico Por esto sentimos que cada 100 horas adicionales de trabajo en auditoriacuteas de camaumentan la cantidad de descubrimientos de impuestos no pagados en $400000 como lo hel pasado

Ademaacutes de la prueba de hipoacutetesis podemos construir un intervalo de confianza para cude los valores de Bi Del mismo modo que bi es una estimacioacuten puntual de Bi estos intervalofianza son estimaciones de intervalo de Bi Para ilustrar el proceso de construccioacuten de interconfianza encontremos un intervalo de confianza del 95 para B3 en el ejemplo del IRS Lrelevantes son

b3 ϭ 0405 de la figura 13-2sb3 ϭ 00422

t ϭ 2447 larr Nivel de significancia del 5 y 6 grados de libertad

Intervalo deconfianza para B i

Realizacioacuten de la

prueba de hipoacutetesis

0597 ndash 0400ᎏᎏ

0081

b1 ndash B10ᎏ

sb1

Anaacute l i s i s de r e gr e s i oacutenLa ec uaci oacuten de r egr es i oacuten esDESCUBRE = - 45 0 + 0 597 AUDI TORIacute A + 1 18 COMPUTADORA + 0 405 RECOMPENSA

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 45 796 4 878 - 9 39 0 000AUDI TORIacute A 0 50697 0 08112 7 36 0 000COMPUTADORA 1 17684 0 08407 14 00 0 000RECOMPENSAS 0 40511 0 04223 9 59 0 000

s = 0 2861 R- s q = 98 3

FIGURA 13-2

Salida de Minitab(figura repetida)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2156

Con esta informacioacuten podemos calcular el intervalo de confianza de la siguiente manera

b3 ϩ t (sb3) ϭ 0405 ϩ 2447(00422)

ϭ 0508 larr Liacutemite superior

b3 Ϫ t (sb3) ϭ 0405 Ϫ 2447(00422)

ϭ 0302 larr Liacutemite inferior

Vemos que podemos tener una seguridad del 95 de que cada $1000 adicionales pagados a los formantes aumenta el descubrimiento de impuestos no pagados en una cantidad entre $302000$508000

A menudo estaremos interesados en preguntas del tipo iquesten realidad Y depende de X i Por ejeplo podriacuteamos preguntar si descubrir impuestos no pagados en realidad depende de las horas encomputadora Con frecuencia esta pregunta se plantea como iquestes X i una variable explicativa sigficativa de Y Si piensa un poco maacutes se convenceraacute de que si Bi 0 Y depende de las X i (esto esvariacutea cuando X i variacutea) y no depende de X i si Bi ϭ 0

Vemos que nuestra pregunta conduce a establecer hipoacutetesis de la forma

H0 Bi ϭ 0 larr Hipoacutetesis nula X i no es una variable explicativa significativa

H1 Bi 0 larr Hipoacutetesis alternativa X i es una variable explicativa significativa

Podemos probar estas hipoacutetesis utilizando la ecuacioacuten 13-8 del mismo modo que cuando probamnuestras hipoacutetesis acerca de si B1 todaviacutea era igual a 0400 Sin embargo existe una forma maacutes faacutede hacerlo usando la columna de la figura 13-2 de ldquocociente- t rdquo Observemos de nuevo la ecuaci13-8

t ϭ [13-

Como nuestro valor hipoteacutetico de Bi es cero el valor estandarizado del coeficiente de regresioacutedenotado por t o se convierte en

t o ϭ

El valor de t o se conoce como valor t ldquocalculadordquo Eacuteste es el nuacutemero que aparece en la columna equetada como ldquocociente-t rdquo en la figura 13-2 Denotemos por t c el valor t ldquocriacuteticordquo que buscamos

la tabla 2 del apeacutendice Entonces como la prueba para determinar si X i es una variable explicatisignificativa es una prueba de dos colas soacutelo necesitamos verificar si Ϫt c Յ t o Յ t c

Uso de valores t

calculados en lasalida de Minitab

biᎏ

sbi

bi ndash Bi0ᎏ

sbi

iquestEs significativa unavariable explicativa

Prueba para determinar si una variable es o no significativa

Ϫt c Յ t o Յ t c [13-9

donde

bull t c ϭ valor t adecuado (con n Ϫ k Ϫ 1 grados de libertad) para el nivel de significancia deprueba

bull t o ϭ bi sbi ϭ valor t observado (o calculado) obtenido con el paquete de software

Si t o

cae entre Ϫt c

y t c aceptamos H0 y llegamos a la conclusioacuten de que X

ino es una variable exp

cativa significativa En cualquier otro caso rechazamos H0 y concluimos que X i es una variable eplicativa significativa

Probemos al nivel de significancia de 001 si las horas en computadora constituyen una variabexplicativa significativa para los impuestos no pagados descubiertos De la tabla 2 del apeacutendice cn Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad y ϭ 001 vemos que t c ϭ 3707 De la figura 13tenemos que t o = 1400 Como t o Ͼ t c concluimos que el tiempo en computadora es una variab

Prueba de lasignificancia de lavariable horas decomputadora en elproblema del IRS

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2256

explicativa significativa De hecho al observar los valores t calculados para las otras dos vindependientes (tiempo de auditoriacuteas de campo t o ϭ 736 y recompensa a informantes t ovemos que tambieacuten son variables explicativas significativas

Podemos tambieacuten utilizar la columna de ldquoprdquo para probar si X i es una variable explicativacativa De hecho utilizando esa informacioacuten ni siquiera necesitamos usar la tabla 2 del aLos elementos de esta columna son los valores prob para las hipoacutetesis

H0 Biϭ 0

H1 Bi 0

Recuerde del anaacutelisis hecho en el capiacutetulo 9 que estos valores prob constituyen la probabque cada bi esteacute tan lejos de cero como (o maacutes) el valor observado obtenido de la regresioacutenverdadera Como se ilustra en la figura 13-3 solamente necesitamos comparar estos valocon el nivel de significancia de la prueba para determinar si X i es o no una variable expsignificativa para Y

Probar la significancia de una variable explicativa es siempre una prueba de dos colas Lble independiente X i es una variable explicativa significativa si bi es significativamente dife

cero es decir si t o es un nuacutemero grande positivo o negativoPara el ejemplo del IRS repetimos las pruebas con ϭ 001 Para cada una de las tres v

independientes p es menor que 001 de forma que podemos concluir que cada una de ellanificativa

Inferencias acerca de la regresioacuten como un todo

(usando una prueba F )

Suponga que cubre con papel un tablero para dardos y lanza varios dardos sobre eacutel Despueacuteberlo hecho tendraacute algo muy parecido a un diagrama de dispersioacuten Suponga entonces quuna recta de regresioacuten a este conjunto de ldquopuntos observadosrdquo y calcula r

2 Debido a que lofueron lanzados aleatoriamente usted espera obtener un valor bajo de r

2 puesto que en esten realidad no explica a Y Sin embargo si hace esto muchas veces ocasionalmente observalor alto de r

2 por pura casualidadDada cualquier regresioacuten simple (o muacuteltiple) es natural preguntarse si el valor de r2 (

realmente indica que las variables independientes explican a Y o si esto sucede por cas

A menudo esta interrogante se plantea de la siguiente manera iquestla regresioacuten como un todo ficativa En la uacuteltima seccioacuten vimos coacutemo decidir si una X i individual es una variable exp

Significancia de laregresioacuten comoun todo

FIGURA 13-3

Uso de ldquoprdquo paradeterminar si X i esuna variable expli-cativa significativa

Regioacuten de aceptacioacuten Regioacuten de aceptacioacuten

2 del aacuterea

2 del aacuterea

2 del aacuterea

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

ndasht c

ndasht o

t o

t c

0

(a) p es mayor que X

i no es una variable

explicativa significativa

(b) p es menor que X

i es una variable

explicativa significativa

ndasht o

ndasht c

t c

0

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2356

significativa ahora veremos coacutemo decidir si todas las X i tomadas en conjunto explican significavamente la variabilidad observada de Y Nuestras hipoacutetesis son

H0 B1 ϭ B2 ϭ ϭ Bk ϭ 0 larr Hipoacutetesis nula Y no depende de las X i

H1 por lo menos una Bi 0 larr Hipoacutetesis alternativa Y depende de al menos una de las X i

Cuando analizamos r 2 en el capiacutetulo 12 consideramos la variacioacuten total en Y sum(Y Ϫ Y ෆ )2 la p

te de dicha variacioacuten que explica la regresioacuten sum(Y ˆ Ϫ Y ෆ )2 y la parte no explicada de la variacioacutensum(Y Ϫ Y ˆ )2 La figura 13-4 es un duplicado de la figura 12-15 Sirve como repaso de la relacioacuten etre la desviacioacuten total la desviacioacuten explicada y la desviacioacuten no explicada para un solo dato en uregresioacuten simple Aunque no podamos dibujar una figura similar para una regresioacuten muacuteltiple coceptualmente estamos haciendo lo mismo

Al analizar la variacioacuten en Y fijamos nuestra atencioacuten en tres teacuterminos diferentes cada uno de cuales es una suma de cuadrados Los denotamos con

Suma de cuadradosy sus grados delibertad

Anaacutelisis de lavariacioacuten de losvalores Y

FIGURA 13-4

Desviacioacuten totaldesviacioacutenexplicada ydesviacioacuten noexplicada paraun valor observadode Y

Y

X

Un valor observado de lavariable dependiente (Y )

R e c t a d

e r e g r e s

i oacute n

Desviacioacuten no explicada de esta Y respectoa su media Y

(Y ndash Y )^

Desviacioacuten explicada deesta Y respecto a su media Y

(Y ndash Y )^Y

Valor estimado de esta Y

a partir de la recta de regresioacuten (Y )^

Desviacioacuten total de esta Y

respecto a su media Y

(Y ndash Y )

Tres sumas de cuadrados

SCT ϭ suma de cuadrados total (es decir la parte explicada) ϭ sum(Y Ϫ Y ෆ )2

SCR ϭ suma de cuadrados de la regresioacuten (es decir la parte explicada) ϭ sum(Y ˆ Ϫ Y ෆ )2 [13-10

SCE ϭ suma de cuadrados del error (es decir la parte no explicada) ϭ sum(Y Ϫ Y ˆ )2

Estaacuten relacionadas por la ecuacioacuten

que dice que la variacioacuten total en Y puede dividirse en dos partes la parte explicada y la no explicaCada una de estas sumas de cuadrados tiene un nuacutemero asociado de grados de libertad SCT t

ne n Ϫ 1 grados de libertad (n observaciones menos un grado de libertad debido a que la media la muestra estaacute fija) SCR tiene k grados de libertad porque existen k variables independientes qse utilizaron para explicar Y Finalmente SCE tiene n Ϫ k Ϫ 1 grados de libertad porque utilizamnuestras n observaciones para estimar k ϩ 1 constantes a b1 b2 bk Si la hipoacutetesis nula es ci

ta el cociente

Descomposicioacuten de la variacioacuten total de Y

SCT ϭ SCR ϩ SCE [13-1

Cociente F

F ϭ [13-12SCR k ᎏᎏ

SCE(n ndash k ndash 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2456

tiene una distribucioacuten F con k grados de libertad en el numerador y n Ϫ k Ϫ 1 grados de libel denominador Si la hipoacutetesis nula es falsa entonces el cociente tiende a ser maacutes grande qula hipoacutetesis nula es verdadera De modo que si el cociente F es demasiado grande (seguacuten lo na el nivel de significancia de la prueba y el valor apropiado de la tabla 6 del apeacutendice) rechH0 y concluimos que la regresioacuten como un todo es significativa

La figura 13-5 presenta la salida de Minitab para el problema del IRS Esta parte del rincluye los cocientes F calculados para la regresioacuten en ocasiones llamado anaacutelisis de v

(ANOVA) para la regresioacuten Probablemente se pregunte si esto tiene algo que ver con el anaacutelisrianza que estudiamos en el capiacutetulo 11 La respuesta es siacute Aunque no lo hicimos es posibletrar que el anaacutelisis de varianza visto en el capiacutetulo 11 tambieacuten contempla la variacioacuten total las observaciones alrededor de la gran media y la divide en dos partes una explicada por lascias entre los distintos grupos (que corresponde a lo que llamamos varianza entre columnas)

no explicada por dichas diferencias (que corresponde a la varianza dentro de columnas) Estcisamente anaacutelogo a lo que acabamos de hacer en la ecuacioacuten 13-11Para el problema del IRS vemos que SCR ϭ 29109 (con k ϭ 3 grados de libertad) SCE

(con n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad) y que

F ϭ ϭ ϭ 11833

Los elementos en la columna ldquoMCrdquo son justo las sumas de cuadrados divididas entre sus glibertad Para 3 grados de libertad en el numerador y 6 en el denominador la tabla 6 del apeacutence que 978 es el liacutemite superior de la regioacuten de aceptacioacuten para un nivel de significancia El valor calculado de F 11833 estaacute muy por arriba de 978 de manera que se ve que la r

como un todo es altamente significativa Se puede llegar a la misma conclusioacuten si se observresultado del programa dice que ldquo prdquo es 0000 Debido a que este valor prob es menor que elsignificancia ϭ 001 se concluye que la regresioacuten completa es significativa De esta mapuede usar la p de ANOVA como prueba sin tener que utilizar la tabla 6 del apeacutendice para bvalor criacutetico de F Esto es anaacutelogo a la manera en que se usaron los valores de p en la figura ra probar la significancia de las variables explicativas individuales

Multicolinealidad en la regresioacuten muacuteltiple

En el anaacutelisis de regresioacuten muacuteltiple los coeficientes de regresioacuten a menudo se vuelven

confiables conforme aumenta el grado de correlacioacuten entre las variables independie

existe un alto nivel de correlacioacuten entre algunas de las variables independientes nos enfrenun problema que los estadiacutesticos llaman multicolinealidad

La multicolinealidad puede presentarse si deseamos estimar la recuperacioacuten de las ventaempresa y utilizamos tanto el nuacutemero de vendedores empleados como sus salarios totales Cvalores asociados con estas dos variables independientes tienen una correlacioacuten alta neceusar soacutelo un conjunto de ellos para realizar nuestra estimacioacuten De hecho al agregar una segriable que estaacute correlacionada con la primera se distorsionan los valores de los coeficientgresioacuten Sin embargo a menudo podemos predecir bien Y incluso cuando haya multicoline

Consideremos un ejemplo donde existe multicolinealidad para ver coacutemo afecta a la regresrante los 12 meses pasados el gerente del restaurante Pizza Shack ha estado poniendo unaanuncios en el perioacutedico local Los anuncios se programan y pagan el mes anterior a que ap

Un ejemplo demulticolinealidad

Definicioacuten y efecto dela multicolinealidad

9703ᎏ

0082

29109 3ᎏ

0491 6Prueba de lasignificancia de laregresioacuten en elproblema del Serviciode Contribuciones

Anaacutelisis devarianza parala regresioacuten

Prueba F de laregresioacuten como

un todo

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 29 1088 9 7029 118 52 0Er r or 6 0 4912 0 0819Tot al 9 29 6000

FIGURA 13-5Salida de Minitabanaacutelisis devarianza

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2556

Cada anuncio contiene un cupoacuten que permite llevarse dos pizzas pagando solamente la de mcio El gerente recolectoacute los datos de la tabla 13-4 y le gustariacutea utilizarlos para predecir las vpizzas

En las figuras 13-6 y 13-7 se dieron los resultados de Minitab para las regresiones respelas ventas totales sobre el nuacutemero de anuncios y sobre el costo

Para la regresioacuten sobre el nuacutemero de anuncios tenemos que el valor t observado es 395grados de libertad y un nivel de significancia de ϭ 001 se encontroacute que el valor t criacuteticdo de la tabla 2 del apeacutendice) es 3169 Como t o Ͼ t c (o de manera equivalente como p es m001) concluimos que el nuacutemero de anuncios es una variable explicativa altamente signifilas ventas totales Note tambieacuten que r 2 ϭ 610 de modo que el nuacutemero de anuncios explximadamente el 61 de la variacioacuten en las ventas de pizzas

Para la regresioacuten sobre el costo de los anuncios el valor t observado es 454 de modo qude los anuncios es una variable explicativa de las ventas totales todaviacutea maacutes significativa que ro de anuncios (para los que el valor t observado fue soacutelo 395) En esta regresioacuten r 2 ϭ 673

el costo de los anuncios explica aproximadamente el 67 de la variacioacuten de las ventas de pizComo ambas variables explicativas son altamente significativas por siacute mismas intentam

zar ambas en una regresioacuten muacuteltiple El resultado se presenta en la figura 13-8La regresioacuten muacuteltiple es altamente significativa como un todo ya que la p de ANOVA e

Uso de ambas varia-bles explicativas enuna regresioacuten muacuteltiple

Dos regresionessimples

Datos de ventas y anun-cios para el restaurantePizza Shack

Tabla 13-4 X 1 X 2 Y

Nuacutemero Costo de anuncios Venta tode anuncios publicados de pizz

Mes publicados (cientos de doacutelares) (miles de d

Mayo 12 139 436

Junio 11 120 380

Julio 9 93 301

Agosto 7 97 353

Septiembre 12 123 464

Octubre 8 114 342

Noviembre 6 93 302

Diciembre 13 143 407

Enero 8 102 385

Febrero 6 84 226

Marzo 8 112 376

Abril 10 111 352

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esVENTAS = 16 9 + 2 08 ANUNCI OS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 16 937 4 982 3 40 0 007ANUNCI OS 2 0832 0 5271 3 95 0 003

s = 4 206 R- s q = 61 0

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 1 276 31 276 31 15 62 Er r or 10 176 88 17 69Tot a l 11 453 19

Figura 13-6

Regresioacuten de lasventas sobre elnuacutemero deanuncios conMinitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2656

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2756

gar el nuacutemero de anuncios como segunda variable explicativa ademaacutes del costo de los anuncios eplica nada maacutes alrededor del 1 adicional de la variacioacuten de las ventas totales

En este punto es justo preguntarse iquestqueacute variable realmente explica la variacioacuten de las ventotales en la regresioacuten muacuteltiple La respuesta es que ambas la explican pero no podemos separ

sus contribuciones individuales debido a que estaacuten altamente correlacionadas entre siacute E

consecuencia sus coeficientes en la regresioacuten muacuteltiple tienen errores estaacutendar altos valore

calculados relativamente bajos y valores prob Ͼ | t | relativamente altos

iquestDe queacute manera nos afecta esta multicolinealidad Todaviacutea podemos hacer predicciones relativmente precisas cuando se encuentra presente note que para la regresioacuten muacuteltiple (la salida se dala figura 13-8) el error estaacutendar de la estimacioacuten que determina el ancho de los intervalos de co

fianza para las predicciones es 3989 mientras que para la regresioacuten simple con el costo de los anucios como variable explicativa (salida en la figura 13-7) tenemos se ϭ 3849 Lo que no podemhacer es predecir con mucha precisioacuten coacutemo cambiaraacuten las ventas si aumentamos en uno el nuacutemede anuncios La regresioacuten muacuteltiple dice que b1 ϭ 0625 (esto es cada anuncio aumenta las ventotales de pizzas alrededor de $625) pero el error estaacutendar de este coeficiente es 112 (es decir apximadamente $1120)

Las contribucionesindividuales nopueden separarse

Ejercicios 134

Ejercicios de autoevaluacioacuten

EA 13-4 Edith Pratt es una ocupada ejecutiva de una compantildeiacutea de transporte de carga a nivel nacional y va tara una junta porque no encuentra la salida de la regresioacuten muacuteltiple elaborada por un asistente Si la regsioacuten total es significativa al nivel 005 ella desea usar las salida de computadora como evidencia para fudamentar algunas ideas que expondraacute en la reunioacuten Sin embargo su ayudante estaacute enfermo De hectoda la informacioacuten que tiene de la regresioacuten muacuteltiple es un trozo de papel con los siguientes datos

Regresioacuten paraEdith Pratt

SCR 8724 con gl

SCE con 17 gl

SCT 10236 con 24 gl

Como el papel ni siquiera tiene todos los nuacutemeros Edith ha concluido que no es uacutetil Usted sin embardebe saber maacutes que ella iquestPuede Edith entrar en la junta o debe seguir buscando la salida de computador

EA 13-5 Una pequentildea liacutenea aeacuterea de Nueva Inglaterra realizoacute una encuesta sobre sus 15 terminales y obtuvo losguientes datos para el mes de febrero donde

VENTAS ϭ ingreso total seguacuten el nuacutemero de boletos vendidos (en miles de doacutelares)

PROMOCϭ cantidad gastada en promociones de la liacutenea aeacuterea en el aacuterea (en miles de doacutelares)

COMPET ϭ nuacutemero de liacuteneas aeacutereas que compiten en esa terminal

GRATIS ϭ nuacutemero de pasajeros que vuelan gratis (por diferentes razones)

Sugerencia el concepto de hacer infe-rencias respecto a una regresioacuten muacutelti-ple es justo lo mismo que se hizo en elcapiacutetulo 12 cuando hicimos inferencias

respecto a una recta de regresioacuten excepto que ahora se em-

plean dos o maacutes variables independientes Advertencia lamulticolinealidad es un problema que debe manejarse enla regresioacuten muacuteltiple y es necesario desarrollar una com-prensioacuten con sentido comuacuten Recuerde que todaviacutea puedehacer predicciones precisas cuando estaacute presente Pero re-cuerde tambieacuten que no puede decir con mucha precisioacuten

cuaacutento cambiaraacute la variable dependiente si ldquomanipulardquo lavariables independientes Entonces el objetivo debe seminimizar la multicolinealidad Sugerencia la mejor regresioacuten muacuteltiple es la que explica la relacioacuten entre los datos asentildealar la responsabilidad de la mayor proporcioacuten de la va

riacioacuten en la variable dependiente con el menor nuacutemero dvariables independientes Advertencia no es una buenidea incluir demasiadas variables independientes soacutelo porque cuenta con una computadora y un paquete de softwarpara estadiacutestica

SUGERENCIAS

Y

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2856

Ventas (doacutelares) Promoc (doacutelares) Compet Gratis

793 25 10 3

2001 55 8 6

1632 60 12 9

2001 79 7 16

1460 52 8 15

1777 76 12 9

309 20 12 8

2919 90 5 10

1600 40 8 43394 96 5 16

1596 55 11 7

863 30 12 6

2375 60 6 10

1072 50 10 4

1550 35 10 4

a) Utilice la siguiente salida de Minitab para determinar la ecuacioacuten de regresioacuten que mejor se ara la liacutenea aeacuterea

La ec uaci oacuten de r egr es i oacuten esVENTAS ϭ 172 ϩ 25 9 PROMOVϪ 13 2 COMPET Ϫ 3 04 GRATI S

Pr onos t i cador Coef Des vEs t Coci ent e - t Cons t ant e 172 34 51 38 3 35 0PROMOV 25 950 4 877 5 32 0COMPET - 13 238 3 686 - 3 59 0GRATI S - 3 041 2 342 - 1 30 0

b) iquestLos pasajeros que vuelan gratis ocasionan una disminucioacuten significativa en las ventas Fpruebe las hipoacutetesis apropiadas Use ϭ 005

c) iquestUn incremento de $1000 en las promociones cambia las ventas en $28000 o el cambio ecativamente diferente de $28000 Formule y pruebe las hipoacutetesis adecuadas Use ϭ 010

d) Calcule un intervalo de confianza del 90 para el coeficiente de la pendiente de la COMPET

Aplicaciones

13-22 Mark Lowtown publica el perioacutedico Mosquito Junction Enquirer y tiene problemas para predectidad de papel perioacutedico que necesita imprimir diariamente Eligioacute aleatoriamente 27 diacuteas del arior y registroacute la siguiente informacioacuten

PESO ϭ peso en libras de papel perioacutedico para la edicioacuten de ese diacutea

CLASIFICADOS ϭ nuacutemero de anuncios clasificados

PUBLICIDAD ϭ nuacutemero de anuncios publicitarios

PLANA COMPLETA ϭ nuacutemero de anuncios a una plana

Utilizando Minitab para hacer una regresioacuten de PESO sobre las otras tres variables Mark obtuguiente salida

Pr onos t i cador Coef Des vEs t Coci ent e- t Cons t ant e 1072 95 872 43 1 23 0CLASI FI CADOS 0 251 0 126 1 99 0PUBLI CI DAD 1 250 0 884 1 41 0PLANA COMPLETA 250 66 67 92 3 69 0

a) Mark siempre ha pensado que cada anuncio publicitario utiliza al menos 3 libras de papel iquestsioacuten le da una razoacuten significativa para dudar esto al nivel del 5

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2956

b) De manera similar Mark siempre ha creiacutedo que cada anuncio clasificado utiliza aproximmedia libra de papel iquestTiene ahora Mark una razoacuten significativa para dudar esto al nivel del

c) Mark vende espacios de anuncios de plana completa a los comerciantes locales a $30 la paacutegberaacute pensar en ajustar sus tarifas si el papel perioacutedico le cuesta $009 por libra Suponga costos son despreciables Establezca expliacutecitamente las hipoacutetesis y una conclusioacuten (Sugere

jando todo lo demaacutes constante cada anuncio adicional de plana completa tiene un costo de bras de papel ϫ $009 por libra ϭ $2256 El punto de equilibrio es 333333 libras iquestPor quel coeficiente de pendiente para PLANA COMPLETA es significativamente mayor que Mark no estaacute obteniendo ganancias y debe cambiar sus tarifas)

13-23 Para los datos del ejercicio 13-18 y un nivel de significancia de 010 iquestcuaacuteles variables son sign

mente explicativas de los resultados de los exaacutemenes (Habiacutea 12 estudiantes en la muestra) 13-24 Para los datos del ejercicio 13-18 y la siguiente salida de Minitab del procedimiento de regresiple hecho por Bill

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 3134 42 783 60Er r or 7 951 25 135 89Tot a l 11 4085 67

a) iquestCuaacutel es el valor observado de F b) A un nivel de significancia de 005 iquestcuaacutel es el valor criacutetico de F que se debe utilizar para d

si la regresioacuten como un todo es significativac) Basaacutendose en las respuestas a los incisos a) y b) iquestes la regresioacuten significativa como un tod

13-25 Remiacutetase al ejercicio 13-19 A un nivel de significancia de 001 iquestes la variable DISTANCIA uble explicativa significativa para VENTAS

13-26 Para los datos del ejercicio 13-19 y la siguiente salida adicional de Minitab al correr la regresioacuten

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 2861495 715374 102 39 0Er r or 18 125761 6896 7Tot a l 22 2987256

Al nivel de significancia de 005 iquestes la regresioacuten significativa como un todo

13-27 Henry Lander es el director de produccioacuten de la Alecos Corporation de Caracas Venezuela Hede que le ayude a determinar una foacutermula para predecir el ausentismo de los empacadores de chipoacutetesis es que la temperatura diaria promedio puede explicar el porcentaje de ausentismo Durios meses reuacutene datos ejecuta el procedimiento de regresioacuten simple y encuentra que la tempeplica 66 de la variacioacuten en el ausentismo Pero Henry no estaacute convencido de que eacuteste sea un cador satisfactorio Sugiere que la precipitacioacuten pluvial diaria podriacutea tambieacuten tener algo que vausentismo de modo que registra los datos correspondientes y hace una regresioacuten del ausentismte el tiempo de lluvias y obtiene un valor R2 de 059 ldquoiexclEurekardquo grita usted ldquoiexclLo tengo Con uticador que explica 66 y otro que explica 59 todo lo que tengo que hacer es una regresioacutenutilizando ambos y seguramente tendreacute un pronosticador casi perfectordquo Para su desaacutenimo sin la regresioacuten muacuteltiple tiene una R

2 de soacutelo 68 que es solamente un poco mejor que la variablperatura sola iquestCoacutemo puede explicar esta aparente discrepancia

13-28 Juan Armenlegg administrador de Rockyrsquos Diamond y Jewelry Store estaacute interesado en desamodelo para estimar la demanda del consumidor para su costosa mercanciacutea Como la mayoriacutea de

tes compran diamantes y joyas a creacutedito Juan estaacute seguro de que dos factores que deben influirmanda de los clientes son la tasa real de inflacioacuten anual y la tasa real de intereses sobre preacutestamprincipales bancos del paiacutes Explique algunos problemas que Juan podriacutea encontrar si fuera a dun modelo de regresioacuten basado en estas dos variables de prediccioacuten

13-29 Un nuevo programa de juegos Check That Model pide a los concursantes que especifiquen el nuacutenimo de paraacutemetros que necesitan para determinar si un modelo de regresioacuten muacuteltiple es signifimo un todo para ϭ 001 Usted ganoacute la apuesta con 4 paraacutemetros Use la siguiente informacioacutenterminar si la regresioacuten es significativa

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3056

R 2

ϭ 07452

SCE ϭ 1254

n ϭ 18

Nuacutemero de variables independientes ϭ 3

13-30 La Scottish Turist Agency estaacute interesada en el nuacutemero de turistas que entran al paiacutes cada semanrante la temporada alta Se recolectaron los siguientes datos

Turistas (Y ) ϭ nuacutemero de turistas que entran a Escocia en una semana (en miles)

Cambio (X 1)ϭ nuacutemero de libras escocesas compradas por $1 doacutelar

Precio (X 2) ϭ nuacutemero de libras escocesas cobradas por viaje redondo en camioacuten de Londres a Edimburgo

Promoc (X 3) ϭ cantidad gastada en promocioacuten del paiacutes (en miles de libras escocesas)Temp (X 4) ϭ temperatura media durante la semana en Edimburgo (en grados Celsius)

Turistas (Y ) Cambio (X 1) Precio (X 2) Promoc (X 3) Temp (X 4)

69 061 40 87 154

71 059 40 88 156

68 063 40 85 154

79 061 35 86 153

76 060 35 94 158

82 065 35 99 162

80 058 35 98 164

84 059 35 102 166

97 061 30 114 174

98 062 30 116 172

72 057 40 84 176

67 055 40 86 164

a) Utilice el paquete de software que tenga para determinar la ecuacioacuten de regresioacuten que mejote a los datos de la agencia de turismo

b) iquestEs la tasa de cambio una variable explicativa significativa Establezca y pruebe las hipoacutetesidas a un nivel de significancia de 010

c) Un incremento de 1000 libras en las promociones iquestaumenta el nuacutemero de turistas en maacutesEstablezca y pruebe las hipoacutetesis adecuadas para un nivel de significancia de 005

d) Calcule un intervalo de confianza del 95 para el coeficiente de la pendiente de Temp

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-4 Como SCT ϭ SCR ϩ SCE SCE ϭ SCT Ϫ SCR ϭ 10236 Ϫ 8724 ϭ 1512Como gl SCT ϭ gl SCR ϩ gl SCE gl SCR ϭ gl SCT Ϫ gl SCE ϭ 24 Ϫ 17 ϭ 7

Entonces F ϭ ϭ ϭ 1401

F CRiacuteT ϭ F (7 17 005) ϭ 261Como F OBS gt F CRIacuteT se concluye que la regresioacuten es significativa como un todo Edith debe conticando la salida de computadora de la regresioacuten para usarla en la junta

EA 13-5 De la salida de computadora se obti enen los siguientes resultadosa) VENTAS ϭ 17234 ϩ 25950PROMOC Ϫ13238COMPET Ϫ 3041GRATISb) H0 BGRATIS ϭ 0 H1 BGRATIS Ͻ 0 ϭ 005

Eacutesta es una prueba de una cola y el valor prob en los resultados es para la alternativa de dos c BGRATIS 0 De manera que para esta prueba el valor prob es 02212 ϭ 0111 Ͼ ϭ 00que no se puede rechazar H0 las ventas no disminuyen significativamente cuando aumenta ro de pasajeros que vuelan gratis

c) H0 BPROMOC ϭ 28 H1 BPROMOC 28 ϭ 010

87247ᎏᎏ

151217SCRk ᎏᎏ

SCE(n Ϫ k Ϫ 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3156

El valor observado t de los resultados de regresioacuten es

ϭ ϭ Ϫ0420

Con 11 grados de libertad y ϭ 010 en ambas colas combinadas los valores criacuteticos t parba son Ϯ1796 asiacute el valor observado estaacute dentro de la regioacuten de aceptacioacuten No se rechacambio en VENTAS para un incremento de una unidad ($1000) en PROMOC no es significate diferente de 28 ($28000)

d) Con 11 grados de libertad el valor t para un intervalo del 90 de confianza es 1796 por lo

tervalo esbCOMP Ϯ 1796sbCOMP

ϭ Ϫ13238 Ϯ 1796(3686)

ϭ Ϫ13238 Ϯ 6620 ϭ (Ϫ19858 Ϫ 6618)

La liacutenea aeacuterea puede tener una seguridad del 90 de que el ingreso por los boletos en una ofminuye entre $6600 y $19900 aproximadamente con cada liacutenea aeacuterea adicional que comp

135 Teacutecnicas de modelado

Dada una variable que deseamos explicar y un conjunto de variables explicativas potencialehaya varias ecuaciones de regresioacuten diferentes que podamos estudiar dependiendo de queacute explicativas incluyamos y de coacutemo lo hagamos Cada una de esas ecuaciones de regresioacutence como modelo Las teacutecnicas de modelado son las distintas formas en que podemos incluriables explicativas y verificar queacute tan apropiados son los modelos de regresioacuten Existen municas de modelado diferentes pero soacutelo veremos dos de las maacutes utilizadas

Datos cualitativos y variables ficticias

En todos los ejemplos de regresioacuten que hemos visto hasta ahora los datos manejados hanmeacutericos o cuantitativos Pero ocasionalmente nos enfrentaremos con una variable categoacuterilitativa En el problema del inicio el capiacutetulo el director de personal desea ver si el salarioun vendedor depende de su sexo En la tabla 13-5 repetimos los datos de dicho problema

Por el momento ignore la antiguumledad y utilice la teacutecnica desarrollada en el capiacutetulo 9 bar la diferencia entre las medias de dos poblaciones para ver si los hombres ganan maacutes qu

jeres Pruebe con ϭ 001 Si tomamos a los hombres como la poblacioacuten 1 y a las mujerespoblacioacuten 2 probaremos las siguientes hipoacutetesis

H0 1 ϭ 2 larr Hipoacutetesis nula no existe discriminacioacuten por sexo en los salarios base

H1 1 Ͼ 2 larr Hipoacutetesis alternativa se discrimina a las mujeres en su salario base

ϭ 001 larr Nivel de significancia

Revisioacuten del enfoqueanterior del problema

Buacutesqueda dediferentes modelos

25950 Ϫ 28ᎏᎏ

4877

(bPROMOC Ϫ 28)ᎏᎏ

sbPROMOC

Datos para el problemade discriminacioacuten porsexo

Tabla 13-5 Vendedores VendedorasAntiguumledad Salario base Antiguumledad Salario base(en meses) (en miles) (en meses) (en miles)

6 75 5 62

10 86 13 87

12 91 15 94

18 103 21 98

30 130

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3256

A continuacioacuten bosquejamos el anaacutelisis Si tiene problemas para seguirlo deberaacute repasamente la seccioacuten 93

n1 ϭ 5 n2 ϭ 4

x ෆ1 ϭ 97 x ෆ2 ϭ 8525

s2

1 ϭ 4415 s2

2 ϭ 2609

s2

p ϭ

ϭ

ϭ 3641

x ෆ1Ϫ x

ෆ2ϭ s pΊ ϩ

ϭ 128

t ϭ

ϭ

ϭ 092

Con siete grados de libertad el valor t criacutetico para una prueba de cola superior con ϭ 001 eComo el valor t observado de 092 es menor que 2998 no podemos rechazar H0

Entonces el anaacutelisis concluye que no parece haber discriminacioacuten por sexo en los salarPero recuerde que hasta ahora se han ignorado los datos de antiguumledad laboral para el anaacuteli

Antes de seguir vea el diagrama de dispersioacuten de los datos En la figura 13-9 los punto

corresponden a los hombres y los blancos a las mujeres El diagrama de dispersioacuten muestraridad que el salario base aumenta con los antildeos de antiguumledad pero si con la mirada sigue lo qla recta de regresioacuten notaraacute que los puntos negros tienden a estar arriba de ella y los blancos

La figura 13-10 da la salida de una regresioacuten del salario base sobre los meses de antiguumlelos resultados se ve que la antiguumledad es una variable explicativa altamente significativa

Ademaacutes r 2

ϭ 926 que indica que la variable meses de antiguumledad explica cerca del 9variacioacuten en el salario base La figura 13-11 contiene parte de la salida que no se vio antesbla de residuos Para cada punto el residuo es simplemente Y Ϫ Y ˆ que se reconoce como el

Una ldquomiradardquo a los

datos

El enfoque anterior nodetecta discriminacioacuten

(97 ndash 8525) ndash 0ᎏᎏ

128

( x ෆ1 ndash x ෆ2) ndash (1 Ϫ 2)H0

ᎏᎏᎏ

ˆ x ෆ1Ϫ

x ෆ2

1ᎏ

n2

1ᎏ

n1

4(4415) ϩ 3(2609)ᎏᎏᎏ5 ϩ 4 ndash 2

(n1 ndash 1)s21 ϩ (n2 ndash 1)s22ᎏᎏᎏ

n1 ϩ n2 ndash 2

FIGURA 13-9

Diagrama de dis-persioacuten de salariosbase contra mesesde antiguumledad

4 8 12 16 20 24 28

4

8

12

Meses de antiguumledad

S a l a r i o ( m i l e s d e d oacute l a r e s )

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3356

el ajuste de la recta de regresioacuten en ese punto En la figura 13-11 AJUST1 son los valores y RESI1 son los residuos

Tal vez la parte maacutes importante del anaacutelisis del resultado de una regresioacuten sea estusiduos Si la regresioacuten incluye todos los factores explicativos relevantes estos residuo

ser aleatorios Dicho de otro modo si los residuos muestran cualquier patroacuten no aleat

to indica que hay algo sistemaacutetico que afecta el proceso y que no hemos tomado en cu

manera que buscamos patrones en los residuos o para decirlo de forma maacutes pintoresca ldquopmos a los residuos hasta hacerlos hablarrdquo

Si observamos los residuos presentados en la figura 13-11 vemos que los primeros cincoson positivos De modo que para los vendedores tenemos Y ndash Y ˆ Ͼ 0 o Y Ͼ Y ˆ es decir laregresioacuten cae abajo de estos cinco puntos Tres de los cuatro uacuteltimos residuos son negaticonsiguiente para las vendedoras tenemos Y Ϫ Y ˆ Ͻ 0 o Y Ͻ Y ˆ asiacute que la recta de regresicuentra arriba de tres de los cuatro puntos Esto confirma lo que vimos al observar el diagdispersioacuten de la figura 13-9 Este patroacuten no aleatorio en los residuos sugiere que el sexo siacute etor determinante del salario base

iquestCoacutemo podemos incorporar el sexo de los vendedores dentro del modelo de regresioacutencemos utilizando un dispositivo llamado variable ficticia (o variable indicadora) Para lpuntos que representan a los vendedores esta variable tiene valor de 0 y para los cuatro purepresentan a las vendedoras valdraacute 1 Los datos de entrada para nuestra regresioacuten con variticias se dan en la tabla 13-6

Para los datos de la tabla 13-6 se ajusta una regresioacuten de la forma

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

Uso de variablesficticias

Deteccioacuten depatrones en losresiduos

ldquoPresionar a losresiduosrdquo

Anaacutel i s i s de r e gr e s i oacuten

La ec uac i oacuten de r e gr es i oacuten esSALARI O ϭ 5 81 ϩ 0 233 MESES

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t pCons t a nt e 5 8093 0 4038 14 39 0 000MESES 0 23320 0 02492 9 36 0 000

s ϭ 0 5494 R- s q ϭ 92 6

Anaacute l i s i s de va r i a nz aFUENTE GL SC MC F Re gr e s i oacuten 1 26 443 24 443 87 61 0Er r or 7 2 113 0 302Tot a l 8 28 556

FIGURA 13-10

Regresioacuten conMinitab del salariobase sobre losmeses deantiguumledad

RENGLOacuteN SALARI O AJ UST1 RESI 1

1 7 5 7 2085 0 2914992 8 6 8 1413 0 458684

3 9 1 8 6077 0 4922764 10 3 10 0069 0 2930545 13 0 12 8054 0 1946076 6 2 6 9753 - 0 7752977 8 7 8 8409 - 0 1409288 9 4 9 3073 0 0926649 9 8 10 7066 - 0 906558

FIGURA 13-11

Tabla de residuosde Minitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 256

Un fabricante de fotocopiadoras y procesadores de texto pequentildeospara oficina paga a sus vendedores un salario base reducidomaacutes una comisioacuten igual a un porcentaje fijo de las ventas de

cada vendedor Uno de ellos afirma que esta estructura salarial esdiscriminatoria para las mujeres Los salarios base actuales de los nuevevendedores de la compantildeiacutea son los siguientes

La directora de personal observa que el salario base depende de laantiguumledad del vendedor en la compantildeiacutea pero no sabe coacutemo utilizar losdatos obtenidos para darse cuenta de si depende tambieacuten de su sexo ysi existe discriminacioacuten hacia las mujeres Los meacutetodos que analizaremosen este capiacutetulo le permitiraacuten averiguarlo

131 Anaacutelisis de regresioacuten muacuteltipley correlacioacuten

Como se mencionoacute en el capiacutetulo 12 podemos utilizar maacutes de una variable independiente para esti-mar la variable dependiente e intentar de esta manera aumentar la precisioacuten de la estimacioacuten Esteproceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten Estaacute basado en las mismas su-posiciones y procedimientos que encontramos al utilizar la regresioacuten simple

Considere al agente de bienes raiacuteces que desea relacionar el nuacutemero de casas que la firma vendeen un mes con el monto de su publicidad mensual Ciertamente podemos encontrar una ecuacioacuten de

estimacioacuten sencilla que relacione a estas dos variables iquestPodemos tambieacuten hacer maacutes precisa nues-tra ecuacioacuten incluyendo en el proceso de estimacioacuten el nuacutemero de vendedores que emplea cada mesProbablemente la respuesta sea siacute Y ahora como deseamos utilizar tanto el nuacutemero de agentes deventas como los gastos de publicidad para predecir las ventas mensuales de casas debemos utilizarregresioacuten muacuteltiple no simple para determinar la relacioacuten

La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten dispo-nible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variablespuede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo siagregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estima-cioacuten que describa la relacioacuten con mayor precisioacuten

La regresioacuten muacuteltiple y el anaacutelisis de correlacioacuten implican un proceso de tres pasos como el queusamos en la regresioacuten simple En este proceso

1 Describimos la ecuacioacuten de regresioacuten muacuteltiple2 Examinamos el error estaacutendar de regresioacuten muacuteltiple de la estimacioacuten y3 Utilizamos el anaacutelisis de correlacioacuten muacuteltiple para determinar queacute tan bien la ecuacioacuten de re-

gresioacuten describe los datos observados

Ademaacutes en la regresioacuten muacuteltiple podemos observar cada una de las variables independientes yprobar si contribuyen de manera significativa a la forma en que la regresioacuten describe los datos

Pasos de la regresioacutenmuacuteltiple y lacorrelacioacuten

Ventaja de laregresioacuten muacuteltiple

Uso de maacutes deuna variableindependiente paraestimar la variabledependiente

Agentes de ventas hombres Agentes de ventas mujeresMeses como Salario base Meses como Salario base

empleado (en miles de doacutels) empleada (en miles de doacutels)

6 75 5 62

10 86 13 87

12 91 15 94

18 103 21 98

30 130

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 356

En este capiacutetulo veremos coacutemo encontrar la ecuacioacuten de regresioacuten de mejor ajuste para un co junto dado de datos y coacutemo analizar la ecuacioacuten obtenida Aunque mostraremos coacutemo se puede hcer regresioacuten muacuteltiple a mano o con una calculadora pronto seraacute evidente que no conviene hacersiquiera un problema real pequentildeo a mano Afortunadamente hay muchos paquetes de software dponibles para hacer regresiones muacuteltiples y otros anaacutelisis estadiacutesticos Estos paquetes realizan ldquooperaciones numeacutericasrdquo y lo dejan libre para concentrarse en el anaacutelisis del significado de la ecucioacuten de estimacioacuten resultante

La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacuteccas de variables ficticias podemos incluir factores cualitativos tales como el sexo en nuestra regsioacuten muacuteltiple Esta teacutecnica nos permitiraacute analizar el problema de discriminacioacuten con que abrimos

presente capiacutetulo Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutenicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de nuetras ecuaciones de estimacioacuten

Paquetes de softwarepara regresioacuten

Ejercicios 131

Conceptos baacutesicos

13-1 iquestPor queacute utilizamos regresioacuten muacuteltiple en lugar de regresioacuten simple al estimar una variable dependien 13-2 iquestDe queacute manera se utilizaraacuten las variables ficticias en nuestro estudio de regresioacuten muacuteltiple

13-3 iquestA queacute se refiere la palabra muacuteltiple en la frase regresioacuten muacuteltiple 13-4 La duentildea de una cadena de almacenes desea predecir las ventas mensuales a partir del tamantildeo de la cdad donde se localiza una tienda Despueacutes de ajustar un modelo de regresioacuten simple decide que deincluir el efecto de la temporada del antildeo en el modelo iquestSe puede hacer esto utilizando las teacutecnicas del prsente capiacutetulo

13-5 Describa los tres pasos del proceso de anaacutelisis de regresioacuten muacuteltiple y correlacioacuten 13-6 iquestLos procedimientos utilizados en la regresioacuten muacuteltiple difieren mucho de los usados en regresioacuten si

ple Explique su respuesta

132 Deduccioacuten de la ecuacioacutende regresioacuten muacuteltiple

Veamos coacutemo podemos calcular la ecuacioacuten de regresioacuten muacuteltiple Por conveniencia utilizaremsoacutelo dos variables independientes en el problema que trabajaremos en esta seccioacuten Sin embargtenga en mente que en principio la misma clase de teacutecnica se aplica a cualquier nuacutemero de variabindependientes

El Servicio Interno de Contribuciones (IRS Internal Revenue Service) de Estados Unidos etratando de estimar la cantidad mensual de impuestos no pagados descubiertos por su departamende auditoriacuteas En el pasado el IRS estimaba esta cantidad con base en el nuacutemero esperado de horastrabajo de auditoriacuteas de campo En los uacuteltimos antildeos sin embargo las horas de trabajo de auditorde campo se han convertido en un pronosticador erraacutetico de los impuestos no pagados reales Comresultado la dependencia estaacute buscando otro factor para mejorar la ecuacioacuten de estimacioacuten

El departamento de auditoriacuteas tiene un registro del nuacutemero de horas que usa sus computador

para detectar impuestos no pagados iquestPodriacuteamos combinar esta informacioacuten con los datos referetes a las horas de trabajo de auditoriacuteas de campo y obtener una ecuacioacuten de estimacioacuten maacutes precpara los impuestos no pagados descubiertos cada mes En la tabla 13-1 se presentan esos datos pra los uacuteltimos 10 meses

En la regresioacuten simple X es el siacutembolo utilizado para los valores de la variable independiente En

regresioacuten muacuteltiple tenemos maacutes de una variable independiente Entonces seguiremos usando X pero ag

garemos un subiacutendice (por ejemplo X 1 X 2) para diferenciar cada una de las variables independientes

Siacutembolos adecuados

Un problema queilustra la regresioacutenmuacuteltiple

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 456

En este problema X 1 representa el nuacutemero de horas de trabajo de auditoriacutea de campo y X 2 el nuacute-mero de horas en computadora La variable dependiente Y seraacute los impuestos reales no pagados des-cubiertos

Recuerde que en la regresioacuten simple la ecuacioacuten de estimacioacuten Y ˆ ϭ a ϩ bX describe la relacioacutenentre las dos variables X y Y En regresioacuten muacuteltiple debemos extender esa ecuacioacuten agregando unteacutermino para cada nueva variable En siacutembolos la ecuacioacuten 13-1 es la foacutermula que se usa cuando te-nemos dos variables independientes

Ecuacioacuten deestimacioacuten pararegresioacuten muacuteltiple

Definicioacuten de lasvariables

Datos de los registros deauditoriacuteas del IRS de losuacuteltimos 10 meses

Tabla 13-1 X 1 X 2 Y

Horas de trabajo de Horas en Impuestos realesauditoriacutea de campo computadora no pagados descubiertos

Mes (dos ceros omitidos) (dos ceros omitidos) (millones de doacutelares)

Enero 45 16 29

Febrero 42 14 24

Marzo 44 15 27

Abril 45 13 25

Mayo 43 13 26

Junio 46 14 28

Julio 44 16 30Agosto 45 16 28

Septiembre 44 15 28

Octubre 43 15 27

Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 [13-1]

Ecuaciones normales

Y ϭ na ϩ b1 X 1 ϩb2 X 2 [13-2]

X 1Y ϭ a X 1 ϩ b1 X 2

1 ϩb2 X 1 X 2 [13-3]

X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩb2 X 2

2 [13-4]

donde

bull Y ˆ ϭ valor estimado correspondiente a la variable dependientebull a ϭ ordenada Y

bull X 1 y X 2 ϭ valores de las dos variables independientesbull b1 y b2 ϭ pendientes asociadas con X 1 y X 2 respectivamente

Podemos visualizar la ecuacioacuten de estimacioacuten simple como una recta en una graacutefica de manerasimilar podemos representar una ecuacioacuten de regresioacuten muacuteltiple de dos variables como un plano

como el que ilustra la figura 13-1 Se trata de una forma o figura tridimensional con profundidadlargo y ancho Para obtener una idea intuitiva de esta forma tridimensional visualice la interseccioacutende los ejes Y X 1 y X 2 como un rincoacuten de una habitacioacuten

La figura 13-1 es una graacutefica de los 10 puntos de la muestra y el plano alrededor del cual estospuntos parecen agruparse Algunos estaacuten arriba del plano y otros abajo del mismo modo que los pun-tos estaban arriba y abajo de la recta de regresioacuten simple

Nuestro problema consiste en decidir cuaacutel de los planos que podemos dibujar seraacute el que mejorse ajuste Para hacer esto de nuevo utilizaremos el criterio de miacutenimos cuadrados y localizaremosel plano que minimice la suma de los cuadrados de los errores es decir de las distancias de los pun-tos alrededor del plano a los puntos correspondientes sobre el plano Usemos nuestros datos y las si-guientes tres ecuaciones para determinar los valores de las constantes numeacutericas a b1 y b2

Uso del criterio demiacutenimos cuadradospara ajustar un planode regresioacuten

Visualizacioacuten de laregresioacuten muacuteltiple

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 556

Error Punto correspondienteen el plano

Punto observado

Plano formado a traveacutesde los puntos de la muestraY = a + b 1X 1 + b 2X 2^

a = ordenada Y

X 1

X 2

Y FIGURA 13-1

Plano de regresioacutenmuacuteltiple para 10datos

Podemos obtener a b1 y b2 los coeficientes del plano de regresioacuten resolviendo las ec13-2 13-3 y 13-4 Obviamente la mejor manera de calcular todas las sumas implicadas en ecuaciones es elaborar una tabla para recolectar y organizar la informacioacuten necesaria comen la regresioacuten simple Esto se presenta en la tabla 13-2 para el problema del IRS

Ahora utilizando la informacioacuten de la tabla 13-2 en las ecuaciones 13-2 13-3 y 13-4 obtres ecuaciones con tres constantes desconocidas (a b1 y b2)

272 ϭ 10a ϩ 441b1 ϩ 147b2

12005 ϭ 441a ϩ 19461b1 ϩ 6485b2

4013 ϭ 147a ϩ 6485b1 ϩ 2173b2

Cuando resolvemos estas tres ecuaciones de manera simultaacutenea obtenemos

a ϭ Ϫ13828

b1 ϭ Ϫ 0564

b2 ϭ Ϫ 1099

Sustituyendo estos tres valores en la ecuacioacuten de regresioacuten de dos variables (ecuacioacuten 13-l)mos una ecuacioacuten que describe la relacioacuten entre el nuacutemero de horas de trabajo en auditoriacuteaspo el nuacutemero de horas de computacioacuten y los impuestos no pagados descubiertos por el dep

to de auditoriacuteasY ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

ϭ Ϫ13828 ϩ 0564 X 1 ϩ 1099 X 2

El departamento de auditoriacuteas puede utilizar esta ecuacioacuten mensualmente para estimardad de impuestos no pagados que va a descubrir

Suponga que el IRS desea aumentar la cantidad de detecciones de impuestos no pagados ete mes Como los auditores capacitados son escasos el IRS no tiene la intencioacuten de contratnal adicional El nuacutemero de horas de trabajo en auditoriacuteas entonces permaneceraacute en el niv

Uso de la ecuacioacutende regresioacuten muacuteltiplepara estimaciones

Obtencioacuten de a b 1y b 2 resolviendo lasecuaciones 13-213-3 y 13-4

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 656

tubre alrededor de 4300 horas Pero con el fin de aumentar las detecciones de impuestos no p

el IRS espera aumentar el nuacutemero de horas en computadora a cerca de 1600 Como resultad X 1 ϭ 43 larr 4300 horas de trabajo en auditoriacuteas de campo

X 2 ϭ 16 larr 1600 horas de tiempo en computadora

Sustituyendo estos valores en la ecuacioacuten de regresioacuten para el departamento de auditoriacuteanemos

Y ˆ ϭ Ϫ13828 ϩ 0564 X 1 ϩ 1099 X 2

Y ˆ ϭ Ϫ13828 ϩ (0564)(43) ϩ (1099)(16)

Y ˆ ϭ Ϫ13828 ϩ 24252 ϩ 17584

Y ˆ ϭ 28008 larr Detecciones estimadas de $28008000

Por tanto en el pronoacutestico para noviembre el departamento de auditoriacuteas espera enconevasioacuten de impuestos cercana a 28 millones de doacutelares para esta combinacioacuten de factores

Hasta este punto nos hemos referido a a como la ordenada Y y a b1 y b2 como las pendieplano de regresioacuten muacuteltiple Pero para ser maacutes precisos debemos decir que estas constantericas son los coeficientes de regresioacuten estimados La constante a es el valor de Y ˆ (en este catimacioacuten de los impuestos no pagados) si tanto X 1 como X 2 tienen valor cero Los coeficienb2 describen coacutemo los cambios en X 1 y X 2 afectan el valor de Y ˆ En el ejemplo del IRS pode

jar constante el nuacutemero de horas de trabajo de auditoriacutea de campo X 1 y cambiar el nuacutemerras en computadora X 2 Cuando hacemos esto el valor de Y ˆ aumenta en $1099000 por choras adicionales de tiempo en computadora Del mismo modo podemos fijar X 2 y encon

por cada aumento adicional de 100 horas en el nuacutemero de horas de trabajo de auditoriacuteas deY ˆ aumenta $564000

a b 1 y b 2 son loscoeficientes de re-gresioacuten estimados

Interpretacioacuten de laestimacioacuten

Sugerencia si tiene problemas para vi-sualizar lo que hace en realidad la regre-sioacuten muacuteltiple piense en el capiacutetulo 12 yrecuerde que una recta de regresioacuten des-

cribe la relacioacuten entre dos variables En la regresioacuten muacutelti-ple el plano de regresioacuten como el que se ve en la paacuteginaanterior describe la relacioacuten entre tres variables Y X 1 y X 2El concepto del plano de regresioacuten adecuado es el mismo

que el de la recta de regresioacuten adecuada es decir el qnimiza la suma de los cuadrados de las distancias vles entre los puntos de los datos y el plano en este cavez sea uacutetil recordar que cada variable independienteser responsable de cierta variacioacuten en la variable diente La regresioacuten muacuteltiple es soacutelo una manera dvarias variables independientes para hacer un promejor de la variable dependiente

SUGERENCIAS

Y

SUPOSICIONES

Valores para ajustarel plano de miacutenimoscuadrados donden ϭ 10

Tabla 13-2 Y X 1 X 2 X 1Y X 2Y X 1Y 2 X 2

1 X 2

2

(1) (2) (3) (2) ϫ (1) (3) ϫ (1) (2) ϫ (3) (2)2 (3)2

29 45 16 1305 464 720 2025 256

24 42 14 1008 336 588 1764 196

27 44 15 1188 405 660 1936 225

25 45 13 1125 325 585 2025 169

26 43 13 1118 338 559 1849 169

28 46 14 1288 392 644 2116 196

30 44 16 1320 480 704 1936 256

28 45 16 1260 448 720 2025 256 28 44 15 1232 420 660 1936 225

27 43 15 1161 405 645 1849 225

272 441 147 12005 4013 6485 19461 2173 7uarr uarr uarr uarr uarr uarr uarr uarr

Y X 1 X 2 X 1Y X 2Y X 1X 2 X 21 X 22

Y ෆ ϭ 272

X ෆ1 ϭ 441

X ෆ2 ϭ 147

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 756

Ejercicios 132

Ejercicios de autoevaluacioacutenEA 13-1 Dado el siguiente conjunto de datos

a) Calcule el plano de regresioacuten muacuteltipleb) Prediga Y cuando X 1 ϭ 30 y X 2 ϭ 27

Y X 1 X 2

25 35 50

30 67 4211 15 85

22 03 14

27 46 36

19 20 13

EA 13-2 Se ha reunido la siguiente informacioacuten de una muestra aleatoria de arrendadores de departamentos en uciudad Se intenta predecir la renta (en doacutelares por mes) con base en el tamantildeo del departamento (nuacutemro de habitaciones) y la distancia al centro de la ciudad (en millas)

Renta Nuacutemero de Distancia(doacutelares) habitaciones al centro

360 2 1

1000 6 1450 3 2

525 4 3

350 2 10

300 1 4

a) Calcule la ecuacioacuten de miacutenimos cuadrados que relacione mejor estas tres variablesb) Si alguien busca un departamento de dos habitaciones a 2 millas del centro iquestqueacute renta debe esperar pag

Conceptos baacutesicos 13-7 Dado el siguiente conjunto de datos

a) Calcule el plano de regresioacuten muacuteltipleb) Pronostique Y cuando X 1 ϭ 105 y X 2 ϭ 136

Y X 1 X 2

114 45 132

166 87 187

205 126 198

294 197 254

76 29 228

138 67 178

285 174 146

13-8 Para el siguiente conjunto de datosa) Calcule el plano de regresioacuten muacuteltipleb) Prediga Y cuando X 1 ϭ 28 y X 2 ϭ 10

Y X 1 X 2

10 8 4

17 21 9

18 14 11

26 17 20

35 36 13

8 9 28

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 856

13-9 Dado el siguiente conjunto de datosa) Calcule el plano de regresioacuten muacuteltipleb) Pronostique Y cuando X 1 ϭ Ϫ1 y X 2 ϭ 4

Y X 1 X 2

6 1 3

10 3 Ϫ1

9 2 4

14 Ϫ2 7

7 3 2

5 6 Ϫ4

Aplicaciones

13-10 Sam Spade duentildeo y gerente general de Stationery Store estaacute preocupado por el comportamienventas de un modelo de reproductor de CD y casetes que se venden en la tienda Se da cuenta de ten muchos factores que podriacutean ayudar a explicarlo pero cree que la publicidad y el precio soncipales determinantes Sam reunioacute los siguientes datos

Ventas Publicidad Precio(unidades vend) (nuacutem de anuncios) (doacutelares)

33 3 125

61 6 115

70 10 140

82 13 130

17 9 145

24 6 140

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir las ventas a partir de la publicidad y b) Si la publicidad es 7 y el precio es $132 iquestqueacute ventas podriacutea pronosticar

13-11 Un productor de comida para cerdos desea determinar queacute relacioacuten existe entre la edad de un cerdo empieza a recibir un complemento alimenticio de reciente creacioacuten el peso inicial del anima

mento de peso en un periodo de una semana con el complemento alimenticio La siguiente infoes resultado de un estudio de ocho lechones

X 1 X 2 Y

Nuacutemero Peso inicial Edad inicial Aumentode lechoacuten (libras) (semanas) de peso

1 39 8 7

2 52 6 6

3 49 7 8

4 46 12 10

5 61 9 9

6 35 6 5

7 25 7 38 55 4 4

a) Calcule la ecuacioacuten de miacutenimos cuadrados que mejor describa estas tres variablesb) iquestCuaacutento podemos esperar que un cerdo aumente de peso en una semana con el complemento

ticio si teniacutea nueve semanas de edad y pesaba 48 libras 13-12 Una estudiante graduada que quiere comprar un auto Neptune usado investigoacute los precios Pien

antildeo del modelo y el nuacutemero de millas recorridas influyen en el precio de compra Los datos siguirresponden a 10 autos con precio (Y ) en miles de doacutelares antildeo ( X 1) y millas recorridas ( X 2) en ma) Encuentre (calcule) la ecuacioacuten de miacutenimos cuadrados que mejor relacione estas tres variabb) La estudiante desea comprar un Neptune 1991 con alrededor de 40000 millas recorridas

pronostica que pagaraacute

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 956

(Y ) X 2

Precio X 1 Millas(miles de doacutelares) Antildeo (miles)

299 1987 556

602 1992 184

887 1993 213

392 1988 469

955 1994 118

905 1991 364

937 1992 282

42 1988 44248 1989 349

574 1991 264

13-13 La Reserva Federal de Estados Unidos realiza un estudio preliminar para determinar la relacioacuten etos indicadores econoacutemicos y el cambio porcentual anual en el producto interno bruto (PIB) Dindicadores examinados son el monto del deacuteficit del gobierno federal (en miles de millones de del promedio industrial Dow Jones (el valor medio del antildeo) Los datos correspondientes a seis antilde

Y X 1 X 2

Cambio en el PIB Deacuteficit federal Dow Jones

25 100 2850

Ϫ10 400 2100

40 120 330010 200 2400

15 180 2550

30 80 2700

a) Encuentre (calcule) la ecuacioacuten de miacutenimos cuadrados que mejor describa los datosb) iquestQueacute porcentaje de cambio en el PIB se esperariacutea en un antildeo en el cual el deacuteficit federal fue

millones de doacutelares y el promedio Dow Jones fue 3000

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-1 a) Y X 1 X 2 X 1Y X 2Y X 1X 2 X 2

1 X 2

2

25 35 50 875 1250 175 1225 2500

30 67 42 2010 1260 2814 4489 1764

11 15 85 165 935 1275 225 7225

22 03 14 66 308 042 009 196

27 46 36 1242 972 1656 2116 1296

19 20 13 380 247 260 400 169

1 ෆ3 ෆ4 ෆ 1 ෆ8 ෆ ෆ6 ෆ 2 ෆ4 ෆ ෆ0 ෆ 4 ෆ7 ෆ3 ෆ ෆ8 ෆ 4 ෆ9 ෆ7 ෆ ෆ2 ෆ 7 ෆ7 ෆ ෆ9 ෆ7 ෆ 8 ෆ4 ෆ ෆ6 ෆ4 ෆ 1 ෆ3 ෆ1 ෆ ෆ5 ෆ0 ෆ

Las ecuaciones 13-2 13-3 y 13-4 se convierten en

Y ϭ na ϩ b1 X 1 ϩ b2 X 2 134 ϭ 6 a ϩ 186b1 ϩ 240 b2

X 1Y ϭ a X 1 ϩ b1 X 21 ϩb2 X 1 X 2 4738 ϭ 186a ϩ 8464b1 ϩ 7797b2

X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22 4972 ϭ 240a ϩ 7797b1 ϩ 13150b2

Al resolver estas ecuaciones de manera simultaacutenea se obtiene

a ϭ 203916 b1 ϭ 23403 b2 ϭ Ϫ13283

De modo que la ecuacioacuten de regresioacuten es Y ˆ ϭ 203916 ϩ 23403 X 1 Ϫ 13283 X 2b) Con X 1 ϭ 30 y X 2 ϭ 27

Y ˆ = 203916 ϩ 23403(30) Ϫ 13283(27) ϭ 2883

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1056

EA 13-2 a) En este problema Y ϭ renta X 1 ϭ nuacutemero de habitaciones X 2 ϭ distancia al centro

Y X 1 X 2 X 1Y X 2Y X 1X 2 X 2

1 X 2

2 Y 2

360 2 1 720 360 2 4 1 129600

1000 6 1 600 1000 6 36 1 1000000

450 3 2 1350 900 6 9 4 202500

525 4 3 2100 1575 12 16 9 272625

350 2 10 700 3500 20 4 100 122500

300 1 4 300 1200 4 1 16 90000

2985 18 21 11170 8535 50 70 131 1820225

Las ecuaciones 13-2 13-3 y 13-4 se convierten en

Y ϭ na ϩ b1 X 1 ϩb2 X 2 2985 ϭ 6a ϩ 18b1 ϩ 21b2

X 1Y ϭ a X 1 ϩ b1 X 21 ϩb2 X 1 X 2 11170 ϭ 18a ϩ 70b1 ϩ 50b2

X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22 8535 ϭ 21a ϩ 50b1 ϩ 131b2

Al resolver estas ecuaciones simultaacuteneas se obtiene

a ϭ 964581 b1 ϭ 1364847 b2 ϭ Ϫ24035

De manera que la ecuacioacuten de regresioacuten es

Y ˆ ϭ 964581 ϩ 1364847 X 1 Ϫ 24035 X 2

b) Cuando el nuacutemero de habitaciones ϭ 2 y la distancia al centro ϭ 2

Y ˆ ϭ 964581 ϩ 1364847(2) Ϫ 24035(2) ϭ $365

133 La computadora y la regresioacutenmuacuteltiple

En el capiacutetulo 12 y hasta donde vamos de eacuteste hemos presentado problemas simplificados y muestrasde tamantildeo pequentildeo Despueacutes del ejemplo de la seccioacuten anterior probablemente usted haya llegadoa la conclusioacuten de que no estaacute interesado en la regresioacuten si tiene que hacer los caacutelculos a mano Dehecho conforme aumenta el tamantildeo de las muestras y crece el nuacutemero de variables independientespara la regresioacuten hacer los caacutelculos incluso con la ayuda de una calculadora de bolsillo se convier-te en algo muy inconveniente

Sin embargo como administradores debemos manejar problemas complejos que requieren mues-tras maacutes grandes y variables independientes adicionales Como ayuda para resolver estos problemasmaacutes detallados utilizaremos una computadora que nos permitiraacute realizar un gran nuacutemero de caacutelcu-los en poco tiempo

Suponga que tenemos no una ni dos variables independientes sino un nuacutemero k de ellas X 1

X 2 X k Como antes sea n el nuacutemero de datos que se tienen La ecuacioacuten de regresioacuten que inten-tamos estimar es

Inconvenienciadel caacutelculo deregresiones a mano

Ecuacioacuten de estimacioacuten de regresioacuten muacuteltiple

Y ˆ ϭ

b1 X 1ϩ

b2 X 2ϩ ϩ

bk X k [13-5]

Ahora veremos coacutemo podemos utilizar una computadora para estimar los coeficientes de regresioacutenPara demostrar coacutemo una computadora maneja el anaacutelisis de regresioacuten muacuteltiple tomemos el pro-

blema del Servicio Interno de Contribuciones (IRS) de la seccioacuten anterior Suponga que el departa-mento de auditoriacuteas agrega a su modelo la informacioacuten correspondiente a las recompensas para losinformantes La dependencia desea incluir esta tercera variable independiente X 3 debido a que sien-

Demostracioacuten de laregresioacuten muacuteltipleen la computadora

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1156

te que existe cierta relacioacuten entre estas recompensas y el descubrimiento de impuestos no pEn la tabla 13-3 se registroacute la informacioacuten de los uacuteltimos 10 meses

Para resolver este problema la divisioacuten de auditoriacutea usoacute el procedimiento de regresioacutende Minitab Por supuesto todaviacutea no sabemos coacutemo interpretar la solucioacuten que proporciocomo veremos la mayor parte de los nuacutemeros dados en la solucioacuten corresponden muy de c

los estudiados en el contexto de regresioacuten simple

Salida de Minitab

Una vez que se introducen los datos y se eligen las variables dependiente e independientescalcula los coeficientes de regresioacuten y varios estadiacutesticos asociados con la ecuacioacuten de regrveraacute la salida del programa para el problema del IRS La figura 13-2 da la primera parte de la

1 La ecuacioacuten de regresioacuten De los nuacutemeros dados en la columna Coef se puede leercioacuten de estimacioacuten

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ b3 X 3

ϭ Ϫ45796 ϩ 0597 X 1 ϩ 1177 X 2 ϩ 0405 X 3

Podemos interpretar esta ecuacioacuten en una forma similar a la de la ecuacioacuten de regresioacutevariables en la paacutegina 558 Si se mantienen constantes el nuacutemero de horas de audicampo X 1 y el nuacutemero de horas de computadora X 2 y se cambian las recompeninformantes X 3 entonces el valor de Y ˆ aumentaraacute $405000 por cada $1000 pagadosformantes De igual manera al mantener X 1 y X 3 constantes se ve que por cada 1adicionales de tiempo de computadora Y ˆ aumentaraacute $1177000 Por uacuteltimo si se dej

Buacutesqueda e interpre-tacioacuten de la ecuacioacutende regresioacuten

Salida del programaMinitab

Uso de Minitab pararesolver problemasde regresioacuten muacuteltiple

Factores relacionadoscon el descubrimientode impuestos nopagados

Tabla 13-3 Horas en Impueauditoriacuteas Horas Recompensa pagde campo en computadora a informantes descub(cientos) (cientos) (miles) (mill

Mes X 1 X 2 X 3

Enero 45 16 71 2

Febrero 42 14 70 2

Marzo 44 15 72 2

Abril 45 13 71 2

Mayo 43 13 75 2

Junio 46 14 74 2

Julio 44 16 76 3

Agosto 45 16 69 2

Septiembre 44 15 74 2

Octubre 43 15 73 2

FIGURA 13-2

Salida de Minitabpara la regresioacuten

del ServicioInterno deContribuciones

Anaacutel i s i s de r e gr e s i oacuten

La ec ua ci oacuten de r egr es i oacuten es

DESCUBRE ϭ mdash45 0 ϩ 0 597 AUDI T ϩ 1 18 COMPUTADORA ϩ 0 405 RECOMPENS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e Ϫ45 796 4 878 Ϫ9 39 0 000AUDI T 0 50697 0 08112 7 36 0 000COMPUTADORA 1 17684 0 08407 14 00 0 000RECOMPENSA 0 40511 0 04223 9 59 0 000

s ϭ 0 2861 R- s q ϭ 98 3

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1256

tantes X 2 y X 3 se estima que 100 horas adicionales dedicadas a auditoriacuteas de campo descubri-raacuten $597000 adicionales de impuestos no pagados Observe que se redondearon los valoresproporcionados por la regresioacuten dada por Minitab (figura 13-2)

Suponga que en noviembre el IRS intenta dejar las horas de trabajo en auditoriacuteas de cam-po y las horas en computadora en sus niveles de octubre (4300 y 1500) pero decide aumen-tar las recompensas pagadas a los informantes a $75000 iquestCuaacutento de impuestos no pagadosesperan descubrir en noviembre Sustituyendo estos valores en la ecuacioacuten de regresioacuten esti-mada obtenemos

Y ˆ ϭ Ϫ45796 ϩ 0597 X 1 ϩ 1177 X 2 ϩ 0405 X 3

Y ˆ ϭ Ϫ45796 ϩ 0597(43) ϩ 1177(15) ϩ 0405(75)

Y ˆ ϭ Ϫ45796 ϩ 25671 ϩ 17655 ϩ 30375

Y ˆ ϭ 27905 larr Descubrimientos estimados $27905000

De modo que el departamento de auditoriacuteas espera descubrir aproximadamente $28 millonesde evasioacuten de impuestos en noviembre

2 Una medida de dispersioacuten el error estaacutendar de la estimacioacuten de la regresioacuten muacuteltiple Ya quehemos determinado la ecuacioacuten que relaciona a nuestras tres variables necesitamos una me-dida de la dispersioacuten alrededor de este plano de regresioacuten muacuteltiple En la regresioacuten simple laestimacioacuten es maacutes precisa conforme el grado de dispersioacuten alrededor de la regresioacuten es menorLo mismo es cierto para los puntos de la muestra que se encuentran alrededor del plano de re-gresioacuten muacuteltiple Para medir esta variacioacuten debemos utilizar de nuevo la medida conocida co-

mo error estaacutendar de la estimacioacuten

Medicioacuten de ladispersioacuten alrededordel plano de regre-sioacuten muacuteltiple usodel error estaacutendar dela estimacioacuten

Error estaacutendar de la estimacioacuten

se ϭ Ί [13-6]Y ndash Y ˆ )2ᎏᎏ

n Ϫ k Ϫ 1

donde

bull Y ϭ valores muestrales de la variable dependientebull Y ˆ ϭ valores correspondientes estimados con la ecuacioacuten de regresioacutenbull n ϭ nuacutemero de puntos de la muestrabull k ϭ nuacutemero de variables independientes (ϭ 3 en nuestro ejemplo)

El denominador de esta ecuacioacuten indica que en la regresioacuten muacuteltiple con k variables in-

dependientes el error estaacutendar tiene n Ϫ k Ϫ 1 grados de libertad Esto se debe a que los

grados de libertad se reducen de n en k ϩ 1 constantes numeacutericas a b1 b2 hellip b k que se

estimaron a partir de la misma muestra

Para calcular se observamos los errores individuales (Y Ϫ Y ˆ ) en el plano de regresioacuten ajus-tado los elevamos al cuadrado calculamos su media (dividiendo entre n Ϫ k Ϫ 1 en lugar den) y tomamos la raiacutez cuadrada del resultado Debido a la forma en que se calcula se se cono-ce a veces como raiacutez del error cuadraacutetico medio [o raiacutez de mse (mean-square error)] De lasalida de Minitab que usa s en lugar de se para denotar el error estaacutendar vemos que la raiacutez demse en el problema del Servicio Interno de Contribuciones es 0286 es decir $286000

Como en el caso de la regresioacuten simple podemos utilizar el error estaacutendar de la estimacioacuteny la distribucioacuten t para formar un intervalo de confianza alrededor de nuestro valor estimadoY ˆ En el problema de la evasioacuten de impuestospara 4300 horas de trabajo en auditoriacuteas de cam-po 1500 horas en computadora y $75000 de pago a informantes Y ˆ es $27905000 como es-timacioacuten de impuestos no pagados descubiertos y se es $286000 Si deseamos construir unintervalo de confianza del 95 alrededor de esta estimacioacuten de $27905000 miramos enla tabla 2 del apeacutendice en la columna del 5 y localizamos ahiacute el rengloacuten correspondiente a

Intervalos deconfianza para Y ˆ

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1356

n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad El valor apropiado de t para nuestracioacuten del intervalo es de 2447 En consecuencia podemos calcular los liacutemites de nutervalo de confianza como sigue

Y ˆ ϩ t (se) ϭ 27905000 ϩ (2447)(286000)

Y ˆ ϩ t(se) ϭ 27905000 ϩ 699800

Y ˆ ϩ t(se) ϭ 28604800 larr Liacutemite superior

Y ˆ Ϫ t (se) ϭ 27905000 Ϫ (2447)(286000)

Y ˆ ϩ t(se) ϭ 27905000 ndash 699800

Y ˆ ϩ t(se) ϭ 27205200 larr Liacutemite inferior

Con un nivel de confianza del 95 el departamento de auditoriacuteas puede sentirse sque los descubrimientos reales estaraacuten en este intervalo que va de $27205200 a $28Si el IRS desea usar un nivel de confianza menor como 90 puede reducir el intevalores para la estimacioacuten de descubrimientos de impuestos no pagados Igual que cgresioacuten simple podemos utilizar la distribucioacuten normal estaacutendar (tabla 1 del apeacutendaproximar la distribucioacuten t siempre que los grados de libertad (n menos el nuacutemero cientes de regresioacuten estimados) sea un nuacutemero mayor que 30

Al antildeadir la tercera variable independiente (recompensas a informantes) iquestmejoroacuteregresioacuten Como se mide la dispersioacuten de los datos alrededor del plano de regresioacutenmenores de se deberiacutean indicar mejores regresiones Para la regresioacuten de dos variablecimos con anterioridad en este mismo capiacutetulo se resultoacute ser 1076 Como al agregarra variable se se redujo a 0286 vemos que siacute mejoroacute el ajuste de la regresioacuten en este Sin embargo en general no es cierto que al agregar variables siempre se reduzc

3 El coeficiente de determinacioacuten muacuteltiple Al estudiar el anaacutelisis de correlacioacuten simpmos la fuerza de la relacioacuten entre dos variables utilizando el coeficiente de determinla muestra r 2 Este coeficiente de determinacioacuten es la fraccioacuten de la variacioacuten total riable dependiente Y que se explica con la ecuacioacuten de estimacioacuten

Similarmente en la correlacioacuten muacuteltiple mediremos la fuerza de la relacioacuten entre trbles utilizando el coeficiente de determinacioacuten muacuteltiple R

2 o su raiacutez cuadrada R (el cte de correlacioacuten muacuteltiple) Este coeficiente de determinacioacuten muacuteltiple es tambieacuten la

que representa la porcioacuten de la variacioacuten total de Y que ldquoexplicardquo el plano de regr

Note que la salida del programa da el valor 983 para R2 Esto nos dice que las tr

bles independientes explican el 983 de la variacioacuten total de impuestos no pagadobiertos Para la regresioacuten de dos variables hecha antes R2 es soacutelo 0729 asiacute que las trabajo en auditoriacutea de campo y las horas en computadora explican el 729 de la vaagregar las recompensas a los informantes explica el 254 restante de la variacioacuten

Todaviacutea no hemos explicado los nuacutemeros en las columnas etiquetadas con Desvciente t y p de la figura 13-2 Estos nuacutemeros se utilizaraacuten para hacer inferencias acercano de regresioacuten de la poblacioacuten tema que se trataraacute en la seccioacuten 13-4

Uso del coeficientede determinacioacutenmuacuteltiple

Valor de variablesadicionales

Interpretacioacuten delintervalo deconfianza

Ya nadie calcula regresiones a mano hayotras cosas maacutes interesantes en queacute ocu-par nuestro tiempo Se explicoacute la teacutecnicacalculando las soluciones a mano para

que no tenga que pensar en su computadora como en unaldquocaja negrardquo que hace muchas cosas uacutetiles que no puedeexplicar Sugerencia el valor real de usar la computadorapara calcular regresiones muacuteltiples es que puede manejarmuchas variables independientes y obtener una mejor ecua-

cioacuten de estimacioacuten que puede medir si agregar otrble independiente realmente mejora los resultados yposible observar con rapidez el comportamiento de

indica la proporcioacuten de la variacioacuten total de la variapendiente que se explica con las variables indepenLa computadora hace todo el trabajo tedioso mdashsin semdash y le deja tiempo para el trabajo maacutes importcomprender los resultados y usarlos para tomar mdecisiones

SUGERENCIASY

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1456

La ec uac i oacuten de r egr es i oacuten esY = - 12 75 + 17 1 X1 + 0 54 1 X2 - 0 17 4 X3

Pr onos t i c ador Coe f De s vEs t Coc i e nt e - t pCons t a n t e - 1275 2699 - 0 47 0 719X1 17 059 6 908 2 47 0 245X2 0 5406 0 3144 1 72 0 335X3 - 0 1743 0 1005 - 1 73 0 333

s = 396 1 R- s q = 87 2

b) iquestQueacute porcentaje de la variacioacuten total del nuacutemero de solicitudes urgentes de devolucioacuten de impuestosexplica esta ecuacioacuten

c) Para este antildeo el iacutendice econoacutemico es 169 la poblacioacuten residente en un radio de una milla desde la

oficina es 10212 habitantes y el ingreso promedio en Ithaca es $26925 iquestCuaacutentas solicitudes urgen-tes de devolucioacuten de impuestos debe Pam esperar procesar entre el 1 de marzo y el 15 de abril

Conceptos baacutesicos 13-14 Dado el siguiente conjunto de datos utilice el paquete de software que tenga disponible para encontrar la

ecuacioacuten de regresioacuten de mejor ajuste y responda a lo siguientea) iquestCuaacutel es la ecuacioacuten de regresioacutenb) iquestCuaacutel es el error estaacutendar de la estimacioacutenc) iquestCuaacutel es el valor de R

2 para esta regresioacutend) iquestCuaacutel es el valor pronosticado para Y cuando X 1 ϭ 58 X 2 ϭ 42 y X 3 ϭ 51

Y X 1 X 2 X 3

647 35 53 85809 74 16 26246 25 63 45439 37 94 88777 55 14 36206 83 92 25669 67 25 27343 12 22 13

Ejercicios 133

Ejercicios de autoevaluacioacuten

EA 13-3 Pam Schneider posee y opera un despacho de contadores en Ithaca Nueva York Ella piensa que seriacutea uacutetilpredecir el nuacutemero de solicitudes urgentes de devolucioacuten de impuestos que le pediraacuten durante el ajetrea-do periodo del 1 de marzo al 15 de abril para poder planear mejor sus necesidades de personal duranteesta eacutepoca Tiene la hipoacutetesis de que varios factores pueden ser uacutetiles para su pronoacutestico Los datos de es-tos factores y el nuacutemero de solicitudes urgentes de devolucioacuten de impuestos de antildeos pasados son

Y X 2 Nuacutemero de

Poblacioacuten solicitudesresidente X 3 de devolucioacuten

X 1 en un radio Ingreso urgentesIacutendice de una milla promedio (1 de marzo

econoacutemico desde la oficina en Ithaca a 15 de abril)

99 10188 21465 2306106 8566 22228 1266100 10557 27665 1422129 10219 25200 1721179 9662 26300 2544

a) Use el siguiente resultado de Minitab para determinar la ecuacioacuten de regresioacuten maacutes adecuada para es-

tos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1556

13-15 Dado el siguiente conjunto de datos utilice el paquete de software que tenga a su disposicioacuten patrar la ecuacioacuten de regresioacuten de mejor ajuste y responda a lo siguientea) iquestCuaacutel es la ecuacioacuten de regresioacutenb) iquestCuaacutel es el error estaacutendar de la estimacioacutenc) iquestCuaacutel es el valor de R2 para esta regresioacutend) Deacute un intervalo de confianza para la estimacioacuten del 95 para el valor Y cuando los valores X

y X 4 son 524 416 358 y 3 respectivamente

X 1 X 2 X 3 X 4 Y

214 629 219 Ϫ2 228

517 407 429 5 937418 818 698 2 649

118 410 909 Ϫ4 192

716 226 129 8 558

919 615 309 1 231

Aplicaciones

1316 Las estaciones de policiacutea en Estados Unidos estaacuten interesadas en predecir el nuacutemero de arrestodos que deberaacuten procesar cada mes para programar mejor a los empleados de oficina En los daricos el nuacutemero promedio de arrestos (Y ) cada mes tiene influencia del nuacutemero de oficiales en

policiaca ( X 1) la poblacioacuten de la ciudad en miles ( X 2) y el porcentaje de personas desempleadasdad en miles ( X 3) Los datos de estos factores en 15 ciudades se presentan en la tablaa) Utilice el paquete de software que tenga disponible para determinar la ecuacioacuten de regresioacuten

jor se ajuste a estos datosb) iquestQueacute porcentaje de la variacioacuten total en el nuacutemero de arrestos (Y ) explica esta ecuacioacutenc) El departamento de policiacutea de ChapelBoro desea pronosticar el nuacutemero de arrestos mensua

pelBoro tiene una poblacioacuten de 75000 habitantes 82 elementos en su fuerza policiaca y utaje de desempleo del 105 iquestCuaacutentos arrestos pronostica para cada mes

Nuacutemero promedio Nuacutemero de oficiales Tamantildeo de la ciudad (X 2) Porcende arrestos mensuales (Y ) en la fuerza (X 1) en miles de habitantes desemp

3906 68 816 4

5043 94 751 3

6284 125 973 5

7456 175 1235 8

5852 113 1184 11

4503 82 654 9

3278 46 616 12

2605 32 543 18

4775 89 974 4

3898 67 824 6

3124 47 564 8

3675 59 713 7

3744 61 674 9

4946 87 963 11

4875 92 864 4

13-17 Estamos intentando predecir la demanda anual (DEMAND) de cierto producto utilizando las svariables independientes

PRECIO ϭ precio del producto (en doacutelares)

INGRESO ϭ ingreso del consumidor (en doacutelares)

SUB ϭ precio de un bien sustituto (en doacutelares)

( Nota Un bien sustituto es aquel que puede suplir a otro bien Por ejemplo la margarina es untituto de la mantequilla)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1656

Se recolectaron datos correspondientes al periodo 1982-1996

Antildeo Demanda Precio ($) Ingreso ($) Sub ($)

1982 40 9 400 101983 45 8 500 141984 50 9 600 121985 55 8 700 131986 60 7 800 111987 70 6 900 151988 65 6 1000 161989 65 8 1100 17

1990 75 5 1200 221991 75 5 1300 191992 80 5 1400 201993 100 3 1500 231994 90 4 1600 181995 95 3 1700 241996 85 4 1800 21

a) Utilice el paquete de software que tenga disponible para encontrar la ecuacioacuten de regresioacuten ajuste para estos datos

b) iquestSon los signos (ϩ o Ϫ) de los coeficientes de regresioacuten de las variables independientes los qperan Deacute una explicacioacuten breve ( Nota Eacutesta no es una pregunta estadiacutestica soacutelo necesita pesignifican los coeficientes de regresioacuten)

c) Establezca e interprete el coeficiente de determinacioacuten muacuteltiple del problemad) Establezca e interprete el error estaacutendar de la estimacioacuten para el problemae) Seguacuten la ecuacioacuten de regresioacuten obtenida iquestqueacute valor de DEMAND predeciriacutea si el precio de

ductos fue $6 el ingreso del consumidor $1200 y el precio del bien sustituto $17 13-18 Bill Buxton profesor de estadiacutestica de una prominente escuela de administracioacuten tiene un prof

tereacutes en los factores que afectan el desempentildeo de los estudiantes en los exaacutemenes El examen psemestre anterior tuvo una distribucioacuten de calificaciones amplia pero Bill tiene la certeza de qfactores explican esa distribucioacuten permite a sus estudiantes que estudien en tantos libros comoca el coeficiente de inteligencia de los estudiantes variacutea tienen distintas edades y difieren losque dedican a estudiar Con el propoacutesito de desarrollar una foacutermula de prediccioacuten para las califde los exaacutemenes Bill pidioacute a cada estudiante que respondiera al final del examen preguntas refe

tiempo de estudio y nuacutemero de libros utilizados Los registros que teniacutea Bill ya incluiacutean el coefiinteligencia y la edad de modo que reunioacute los datos del grupo y corrioacute la regresioacuten muacuteltiple deLa salida de la corrida de Bill fue la siguiente

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t Con s t a nt e minus49 948 41 55 minus1 20 0HORAS 1 06931 0 98163 1 09 0CI 1 36460 0 37627 3 63 0LI BROS 2 03982 1 50799 1 35 0EDAD minus1 79890 0 67332 minus2 67 0

s = 11 657 R- s q = 76 7

a) iquestCuaacutel es la ecuacioacuten de regresioacuten de mejor ajuste para estos datos

b) iquestQueacute porcentaje de la variacioacuten en las calificaciones se explica con esta ecuacioacutenc) iquestQueacute calificacioacuten esperariacutea usted para un estudiante de 21 antildeos de edad con un coeficiente gencia (CI) de 113 que estudioacute durante cinco horas y utilizoacute tres libros diferentes

13-19 La compantildeiacutea de tiendas de abarrotes Twenty-Two estaacute planeando expandir su cadena Como ayudleccionar los lugares donde abriraacute las nuevas tiendas recolectoacute datos de las ventas semanales de casus 23 tiendas Para explicar la variabilidad de las ventas semanales tambieacuten reunioacute informacioacutencribe cuatro variables que se cree estaacuten relacionadas con las ventas Las variables se definen como

VENTAS ϭ ventas semanales promedio en cada tienda en miles de doacutelares

AUTOS ϭ volumen promedio de traacutensito de automoacuteviles por semana en miles de autos

ENTRADA ϭ facilidad de entradasalida medida en una escala de 1 a 100

INGANUAL ϭ ingreso anual promedio por familia en el aacuterea en miles de doacutelares

DISTANCIA ϭ distancia en millas desde la tienda al supermercado maacutes cercano

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1756

Los datos se analizaron con Minitab y la salida es la siguiente

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t Cons t a nt e 175 37 92 62 1 89 0 0AUTOS - 0 028 0 315 minus0 09 0 9ENTRADA 3 775 1 272 2 97 0 0I NGANUAL 1 990 4 510 0 44 0 6DI STANCI A 212 41 28 090 7 56 0 0

s = 85 587 R- s q = 95 8

a) iquestCuaacutel es la ecuacioacuten de regresioacuten de mejor ajuste dada por Minitab

b) iquestCuaacutel es el error estaacutendar de la estimacioacuten para esta ecuacioacutenc) iquestQueacute fraccioacuten de la variacioacuten en las ventas se explica con esta regresioacutend) iquestQueacute ventas predeciriacutea para una tienda localizada en un vecindario que tuvo un ingreso anu

milia de $20000 estaba a 2 millas del supermercado maacutes cercano se encontraba en una calvolumen promedio semanal de traacutensito de 100000 autos y con una facilidad de entrada de

13-20 Rick Blackburn estaacute pensando en vender su casa Con el fin de decidir el precio que pediraacute poreunido datos de 12 ventas recientes Registroacute el precio de venta (en miles de doacutelares) el nuacutemercuadrados de construccioacuten (en cientos de pies cuadrados) el nuacutemero de pisos el nuacutemero de bantiguumledad de la casa (en antildeos)

Precio de venta Pies cuad Pisos Bantildeos Antiguumledad

4965 89 1 10 2

6795 95 1 10 68115 126 2 15 11

8160 129 2 15 8

9150 190 2 10 22

9525 176 1 10 17

10035 200 2 15 12

10425 206 2 15 11

11265 205 1 20 9

14970 251 2 20 8

16065 227 2 20 18

23250 408 3 40 12

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de

de mejor ajuste para los datosb) iquestCuaacutel es el valor de R2 para esta ecuacioacutenc) Si la casa de Rick tiene 1800 pies cuadrados (ϭ 180 cientos de pies cuadrados) un piso

y seis antildeos de antiguumledad iquestqueacute precio de venta puede esperar Rick 13-21 La Allegheny Steel Corporation ha estado buscando los factores que influyen en la cantidad de

millones de toneladas) que puede vender cada antildeo La administracioacuten sospecha que los siguientfactores principales la tasa anual de inflacioacuten del paiacutes el precio promedio por tonelada del acetado que acota los precios (en doacutelares) de Allegheny y el nuacutemero de automoacuteviles (en millonesfabricantes de autos de Estados Unidos planean producir ese antildeo Se recolectaron los datos de losiete antildeos

Y X 2 X 3

Millones X 1 Cota de Nuacutemero

de tons Tasa de importa- deAntildeo vendidas inflacioacuten ciones automoacuteviles

1993 42 31 310 62

1992 31 39 500 51

1991 40 75 220 57

1990 47 107 450 71

1989 43 155 435 65

1988 37 130 260 61

1987 35 110 305 59

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1856

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de regresioacutende mejor ajuste para los datos

b) iquestQueacute porcentaje de la variacioacuten total de la cantidad de acero vendido (en millones de toneladas) porAllegheny cada antildeo explica esta ecuacioacuten

c) iquestCuaacutentas toneladas de acero deberaacute esperar Allegheny vender en un antildeo en el que la tasa de inflacioacutenes 71 los fabricantes de automoacuteviles norteamericanos planean producir 60 millones de autos y la co-ta promedio del acero importado por tonelada es $350

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-3 De la salida del paquete de software se obtienen los siguientes resultadosa) Y ˆ ϭ Ϫ1275 ϩ 17059 X 1 ϩ 05406 X 2 Ϫ 01743 X 3b) R

2ϭ 872 el modelo explica el 872 de la variacioacuten total en Y

c) Y ˆ ϭ Ϫ1275 ϩ 17059(169) ϩ 05406(10212) Ϫ 01743(26925) ϭ 2436 reembolsos de impuestos

134 Inferencias sobre paraacutemetrosde poblacioacuten

En el capiacutetulo 12 se vio que la recta de regresioacuten de la muestra Y ˆ ϭ a ϩ bX (ecuacioacuten 12-3) esti-maba la recta de regresioacuten de la poblacioacuten Y ϭ A ϩ BX (ecuacioacuten 12-13) La razoacuten por la cual soacute-lo podiacuteamos estimar la recta de regresioacuten de poblacioacuten y no determinarla con exactitud era que los

puntos no caen exactamente en la recta de regresioacuten de la poblacioacuten Debido a las variaciones alea-torias los puntos satisfaciacutean Y ϭ A ϩ BX ϩ e (ecuacioacuten 12-13a) maacutes que a Y ϭ A ϩ BX

En la regresioacuten muacuteltiple se tiene justo la misma situacioacuten Nuestro plano de regresioacuten estimado

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k [13-5]

es una estimacioacuten de un plano de regresioacuten de poblacioacuten verdadero pero desconocido de la forma

Plano de regresioacutende la poblacioacuten

De nuevo los puntos individuales normalmente no caen con exactitud en el plano de regresioacuten depoblacioacuten Consideremos el problema del Servicio Interno de Contribuciones para ver por queacute Notodos los pagos a informantes tendraacuten la misma efectividad Algunas horas en computadora podriacuteanutilizarse para recolectar y organizar datos otras para analizar esos datos en busca de errores y frau-des El eacutexito de la computadora en descubrir impuestos no pagados puede depender de cuaacutento tiempose dedique a cada una de estas actividades Por eacutestas y otras razones algunos de los puntos se en-contraraacuten arriba del plano de regresioacuten y algunos estaraacuten abajo de eacuteste En lugar de satisfacer laecuacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

los puntos individuales satisfaraacuten la ecuacioacuten

Las variaciones alea-torias desplazan lospuntos del plano deregresioacuten

Ecuacioacuten de regresioacuten de la poblacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

Plano de regresioacuten de la poblacioacuten maacutes la variacioacuten aleatoria

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e [13-7a]

La cantidad e que aparece en la ecuacioacuten 13-7a es una variacioacuten aleatoria que en promedio es iguala cero La desviacioacuten estaacutendar de las variaciones individuales e y el error estaacutendar de la estima-cioacuten se que estudiamos en la seccioacuten anterior es una estimacioacuten de e

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1956

Como nuestro plano de regresioacuten de la muestra Y ˆ ϭ a ϩ b1X1 ϩ b2 X 2 ϩ ϩ bk X k (ecuaci13-7) estima el plano de regresioacuten de poblacioacuten desconocido Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk

(ecuacioacuten 13-7) deberemos ser capaces de usarlo para hacer inferencias sobre el plano de regreside la poblacioacuten En esta seccioacuten haremos inferencias acerca de las pendientes ( B1 B2 Bk ) deecuacioacuten de regresioacuten ldquoverdaderardquo (la que se aplica a la poblacioacuten completa) basadas en las pendietes (b1 b2 bk ) de la ecuacioacuten de regresioacuten estimada a partir de la muestra de datos

Inferencias acerca de una pendiente individual B i El plano de regresioacuten se deriva de una muestra y no de la poblacioacuten completa Como resultado

podemos esperar que la ecuacioacuten de regresioacuten verdadera Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k que se aplica a la poblacioacuten completa) sea exactamente igual que la ecuacioacuten estimada a partir observaciones de la muestra Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k Sin embargo podemos utilizarvalor de bi una de las pendientes que calculamos a partir de la muestra para probar hipoacutetesis acca del valor de Bi una de las pendientes del plano de regresioacuten para la poblacioacuten completa

El procedimiento para probar una hipoacutetesis respecto a Bi es parecido al procedimiento analizaen los capiacutetulos 8 y 9 sobre pruebas de hipoacutetesis Para entender este proceso regresemos al probma que relaciona los impuestos no pagados descubiertos con las horas de trabajo en auditoriacuteas campo horas en computadora y recompensas a informantes En la paacutegina 729 sentildealamos que b10597 El primer paso consiste en encontrar un valor para B1 y compararlo con b1 ϭ 0597

Suponga que durante un periodo largo la pendiente de la relacioacuten entre Y y X 1 fue 0400 Paprobar si todaviacutea es vaacutelida podriacuteamos definir las hipoacutetesis como

H0 B1 ϭ 0400 larr Hipoacutetesis nula

H1 B1 0400 larr Hipoacutetesis alternativa

De hecho realizamos la prueba para saber si los datos actuales indican que B1 ha cambiado su vahistoacuterico de 0400

Para encontrar el estadiacutestico de prueba para B1 es necesario hallar primero el error estaacutendar d

coeficiente de regresioacuten El coeficiente de regresioacuten con el que estamos trabajando es b1 de moque el error estaacutendar de este coeficiente se representa con sb1

Resulta demasiado difiacutecil calcular sb1 a mano pero por fortuna Minitab calcula los errores estaacutedar de todos los coeficientes de regresioacuten Por comodidad repetimos la figura 13-2 Los errores taacutendar de los coeficientes se dan en la columna DesvEst de la salida de Minitab

En el cuadro de salida vemos que sb1

es 00811 (Similarmente si deseamos probar una hipoacutesis acerca de B2 vemos que el error estaacutendar apropiado que debemos utilizar es sb2 ϭ 00841) Uvez que encontramos sb1 en la salida de Minitab podemos usar la ecuacioacuten 13-8 para estandarizarpendiente de nuestra ecuacioacuten de regresioacuten ajustada

Estandarizacioacutendel coeficiente deregresioacuten

Error estaacutendar delcoeficientede regresioacuten

Prueba de unahipoacutetesis acerca de B i

Diferencia entre la

ecuacioacuten de regre-sioacuten verdadera y unaestimada a partir delas observacionesde la muestra

Coeficiente de regresioacuten estandarizado

t ϭ [13-8bi ndash Bi0ᎏ

sbi

donde

bull biϭ pendiente de la regresioacuten ajustada

bull Bi0 ϭ pendiente real hipoteacutetica para la poblacioacutenbull sbi ϭ error estaacutendar del coeficiente de regresioacuten

iquestPor queacute utilizamos t para denotar el estadiacutestico estandarizado Recuerde que en la regresioacuten siple utilizamos a y b en la ecuacioacuten 12-7 para calcular se y que se estimaba e la desviacioacuten estaacutedar de las variaciones de los datos (ecuacioacuten 12-13a) Entonces utilizamos se en la ecuacioacuten 12-para encontrar sb el error estaacutendar del coeficiente de regresioacuten que corresponde a la pendiente E

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2056

pezamos con n puntos y los usamos para estimar los dos coeficientes a y b Luego basamtras pruebas en la distribucioacuten t con n Ϫ 2 grados de libertad

De manera similar en la regresioacuten muacuteltiple tambieacuten empezamos con n puntos pero lospara estimar k ϩ 1 coeficientes la ordenada a y k pendientes b1 b2 bk Despueacutes estcientes se usan en la ecuacioacuten 13-6 para calcular se que de nuevo es una estimacioacuten de eviacioacuten estaacutendar de las variaciones de los datos (ecuacioacuten 13-7a) Luego se utiliza se (en ucioacuten que estaacute maacutes allaacute del alcance de este libro) para encontrar s

bi Debido a lo anterior

nuestras pruebas de hipoacutetesis en la distribucioacuten t con n Ϫ k Ϫ 1 (ϭ n Ϫ ( k ϩ l)) grados de En nuestro ejemplo el valor estandarizado del coeficiente de regresioacuten es

t ϭ

ϭ

ϭ 2432 larr Coeficiente de regresioacuten estandarizado

Suponga que estamos interesados en probar nuestras hipoacutetesis al nivel de significancia

Como tenemos 10 observaciones en la muestra y tres variables independientes sabemos n Ϫ k Ϫ 1 o 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad Buscamos en la tabla 2 del apeacutendice en lana de 10 y el rengloacuten de 6 grados de libertad Ahiacute vemos que el valor apropiado de t es 19mo nos preocupa si b1 (la pendiente del plano de regresioacuten de la muestra) es significativamferente de B1 (la pendiente hipoteacutetica del plano de regresioacuten de la poblacioacuten) eacutesta es una pdos colas y los valores criacuteticos son Ϯ1943 El coeficiente de regresioacuten estandarizado es 2se encuentra fuera de la regioacuten de aceptacioacuten de nuestra prueba de hipoacutetesis Por consiguichazamos la hipoacutetesis nula de que B1 todaviacutea es igual a 0400 En otras palabras existe unacia suficientemente grande entre b1 y 0400 para concluir que B1 ha cambiado respecto a histoacuterico Por esto sentimos que cada 100 horas adicionales de trabajo en auditoriacuteas de camaumentan la cantidad de descubrimientos de impuestos no pagados en $400000 como lo hel pasado

Ademaacutes de la prueba de hipoacutetesis podemos construir un intervalo de confianza para cude los valores de Bi Del mismo modo que bi es una estimacioacuten puntual de Bi estos intervalofianza son estimaciones de intervalo de Bi Para ilustrar el proceso de construccioacuten de interconfianza encontremos un intervalo de confianza del 95 para B3 en el ejemplo del IRS Lrelevantes son

b3 ϭ 0405 de la figura 13-2sb3 ϭ 00422

t ϭ 2447 larr Nivel de significancia del 5 y 6 grados de libertad

Intervalo deconfianza para B i

Realizacioacuten de la

prueba de hipoacutetesis

0597 ndash 0400ᎏᎏ

0081

b1 ndash B10ᎏ

sb1

Anaacute l i s i s de r e gr e s i oacutenLa ec uaci oacuten de r egr es i oacuten esDESCUBRE = - 45 0 + 0 597 AUDI TORIacute A + 1 18 COMPUTADORA + 0 405 RECOMPENSA

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 45 796 4 878 - 9 39 0 000AUDI TORIacute A 0 50697 0 08112 7 36 0 000COMPUTADORA 1 17684 0 08407 14 00 0 000RECOMPENSAS 0 40511 0 04223 9 59 0 000

s = 0 2861 R- s q = 98 3

FIGURA 13-2

Salida de Minitab(figura repetida)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2156

Con esta informacioacuten podemos calcular el intervalo de confianza de la siguiente manera

b3 ϩ t (sb3) ϭ 0405 ϩ 2447(00422)

ϭ 0508 larr Liacutemite superior

b3 Ϫ t (sb3) ϭ 0405 Ϫ 2447(00422)

ϭ 0302 larr Liacutemite inferior

Vemos que podemos tener una seguridad del 95 de que cada $1000 adicionales pagados a los formantes aumenta el descubrimiento de impuestos no pagados en una cantidad entre $302000$508000

A menudo estaremos interesados en preguntas del tipo iquesten realidad Y depende de X i Por ejeplo podriacuteamos preguntar si descubrir impuestos no pagados en realidad depende de las horas encomputadora Con frecuencia esta pregunta se plantea como iquestes X i una variable explicativa sigficativa de Y Si piensa un poco maacutes se convenceraacute de que si Bi 0 Y depende de las X i (esto esvariacutea cuando X i variacutea) y no depende de X i si Bi ϭ 0

Vemos que nuestra pregunta conduce a establecer hipoacutetesis de la forma

H0 Bi ϭ 0 larr Hipoacutetesis nula X i no es una variable explicativa significativa

H1 Bi 0 larr Hipoacutetesis alternativa X i es una variable explicativa significativa

Podemos probar estas hipoacutetesis utilizando la ecuacioacuten 13-8 del mismo modo que cuando probamnuestras hipoacutetesis acerca de si B1 todaviacutea era igual a 0400 Sin embargo existe una forma maacutes faacutede hacerlo usando la columna de la figura 13-2 de ldquocociente- t rdquo Observemos de nuevo la ecuaci13-8

t ϭ [13-

Como nuestro valor hipoteacutetico de Bi es cero el valor estandarizado del coeficiente de regresioacutedenotado por t o se convierte en

t o ϭ

El valor de t o se conoce como valor t ldquocalculadordquo Eacuteste es el nuacutemero que aparece en la columna equetada como ldquocociente-t rdquo en la figura 13-2 Denotemos por t c el valor t ldquocriacuteticordquo que buscamos

la tabla 2 del apeacutendice Entonces como la prueba para determinar si X i es una variable explicatisignificativa es una prueba de dos colas soacutelo necesitamos verificar si Ϫt c Յ t o Յ t c

Uso de valores t

calculados en lasalida de Minitab

biᎏ

sbi

bi ndash Bi0ᎏ

sbi

iquestEs significativa unavariable explicativa

Prueba para determinar si una variable es o no significativa

Ϫt c Յ t o Յ t c [13-9

donde

bull t c ϭ valor t adecuado (con n Ϫ k Ϫ 1 grados de libertad) para el nivel de significancia deprueba

bull t o ϭ bi sbi ϭ valor t observado (o calculado) obtenido con el paquete de software

Si t o

cae entre Ϫt c

y t c aceptamos H0 y llegamos a la conclusioacuten de que X

ino es una variable exp

cativa significativa En cualquier otro caso rechazamos H0 y concluimos que X i es una variable eplicativa significativa

Probemos al nivel de significancia de 001 si las horas en computadora constituyen una variabexplicativa significativa para los impuestos no pagados descubiertos De la tabla 2 del apeacutendice cn Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad y ϭ 001 vemos que t c ϭ 3707 De la figura 13tenemos que t o = 1400 Como t o Ͼ t c concluimos que el tiempo en computadora es una variab

Prueba de lasignificancia de lavariable horas decomputadora en elproblema del IRS

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2256

explicativa significativa De hecho al observar los valores t calculados para las otras dos vindependientes (tiempo de auditoriacuteas de campo t o ϭ 736 y recompensa a informantes t ovemos que tambieacuten son variables explicativas significativas

Podemos tambieacuten utilizar la columna de ldquoprdquo para probar si X i es una variable explicativacativa De hecho utilizando esa informacioacuten ni siquiera necesitamos usar la tabla 2 del aLos elementos de esta columna son los valores prob para las hipoacutetesis

H0 Biϭ 0

H1 Bi 0

Recuerde del anaacutelisis hecho en el capiacutetulo 9 que estos valores prob constituyen la probabque cada bi esteacute tan lejos de cero como (o maacutes) el valor observado obtenido de la regresioacutenverdadera Como se ilustra en la figura 13-3 solamente necesitamos comparar estos valocon el nivel de significancia de la prueba para determinar si X i es o no una variable expsignificativa para Y

Probar la significancia de una variable explicativa es siempre una prueba de dos colas Lble independiente X i es una variable explicativa significativa si bi es significativamente dife

cero es decir si t o es un nuacutemero grande positivo o negativoPara el ejemplo del IRS repetimos las pruebas con ϭ 001 Para cada una de las tres v

independientes p es menor que 001 de forma que podemos concluir que cada una de ellanificativa

Inferencias acerca de la regresioacuten como un todo

(usando una prueba F )

Suponga que cubre con papel un tablero para dardos y lanza varios dardos sobre eacutel Despueacuteberlo hecho tendraacute algo muy parecido a un diagrama de dispersioacuten Suponga entonces quuna recta de regresioacuten a este conjunto de ldquopuntos observadosrdquo y calcula r

2 Debido a que lofueron lanzados aleatoriamente usted espera obtener un valor bajo de r

2 puesto que en esten realidad no explica a Y Sin embargo si hace esto muchas veces ocasionalmente observalor alto de r

2 por pura casualidadDada cualquier regresioacuten simple (o muacuteltiple) es natural preguntarse si el valor de r2 (

realmente indica que las variables independientes explican a Y o si esto sucede por cas

A menudo esta interrogante se plantea de la siguiente manera iquestla regresioacuten como un todo ficativa En la uacuteltima seccioacuten vimos coacutemo decidir si una X i individual es una variable exp

Significancia de laregresioacuten comoun todo

FIGURA 13-3

Uso de ldquoprdquo paradeterminar si X i esuna variable expli-cativa significativa

Regioacuten de aceptacioacuten Regioacuten de aceptacioacuten

2 del aacuterea

2 del aacuterea

2 del aacuterea

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

ndasht c

ndasht o

t o

t c

0

(a) p es mayor que X

i no es una variable

explicativa significativa

(b) p es menor que X

i es una variable

explicativa significativa

ndasht o

ndasht c

t c

0

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2356

significativa ahora veremos coacutemo decidir si todas las X i tomadas en conjunto explican significavamente la variabilidad observada de Y Nuestras hipoacutetesis son

H0 B1 ϭ B2 ϭ ϭ Bk ϭ 0 larr Hipoacutetesis nula Y no depende de las X i

H1 por lo menos una Bi 0 larr Hipoacutetesis alternativa Y depende de al menos una de las X i

Cuando analizamos r 2 en el capiacutetulo 12 consideramos la variacioacuten total en Y sum(Y Ϫ Y ෆ )2 la p

te de dicha variacioacuten que explica la regresioacuten sum(Y ˆ Ϫ Y ෆ )2 y la parte no explicada de la variacioacutensum(Y Ϫ Y ˆ )2 La figura 13-4 es un duplicado de la figura 12-15 Sirve como repaso de la relacioacuten etre la desviacioacuten total la desviacioacuten explicada y la desviacioacuten no explicada para un solo dato en uregresioacuten simple Aunque no podamos dibujar una figura similar para una regresioacuten muacuteltiple coceptualmente estamos haciendo lo mismo

Al analizar la variacioacuten en Y fijamos nuestra atencioacuten en tres teacuterminos diferentes cada uno de cuales es una suma de cuadrados Los denotamos con

Suma de cuadradosy sus grados delibertad

Anaacutelisis de lavariacioacuten de losvalores Y

FIGURA 13-4

Desviacioacuten totaldesviacioacutenexplicada ydesviacioacuten noexplicada paraun valor observadode Y

Y

X

Un valor observado de lavariable dependiente (Y )

R e c t a d

e r e g r e s

i oacute n

Desviacioacuten no explicada de esta Y respectoa su media Y

(Y ndash Y )^

Desviacioacuten explicada deesta Y respecto a su media Y

(Y ndash Y )^Y

Valor estimado de esta Y

a partir de la recta de regresioacuten (Y )^

Desviacioacuten total de esta Y

respecto a su media Y

(Y ndash Y )

Tres sumas de cuadrados

SCT ϭ suma de cuadrados total (es decir la parte explicada) ϭ sum(Y Ϫ Y ෆ )2

SCR ϭ suma de cuadrados de la regresioacuten (es decir la parte explicada) ϭ sum(Y ˆ Ϫ Y ෆ )2 [13-10

SCE ϭ suma de cuadrados del error (es decir la parte no explicada) ϭ sum(Y Ϫ Y ˆ )2

Estaacuten relacionadas por la ecuacioacuten

que dice que la variacioacuten total en Y puede dividirse en dos partes la parte explicada y la no explicaCada una de estas sumas de cuadrados tiene un nuacutemero asociado de grados de libertad SCT t

ne n Ϫ 1 grados de libertad (n observaciones menos un grado de libertad debido a que la media la muestra estaacute fija) SCR tiene k grados de libertad porque existen k variables independientes qse utilizaron para explicar Y Finalmente SCE tiene n Ϫ k Ϫ 1 grados de libertad porque utilizamnuestras n observaciones para estimar k ϩ 1 constantes a b1 b2 bk Si la hipoacutetesis nula es ci

ta el cociente

Descomposicioacuten de la variacioacuten total de Y

SCT ϭ SCR ϩ SCE [13-1

Cociente F

F ϭ [13-12SCR k ᎏᎏ

SCE(n ndash k ndash 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2456

tiene una distribucioacuten F con k grados de libertad en el numerador y n Ϫ k Ϫ 1 grados de libel denominador Si la hipoacutetesis nula es falsa entonces el cociente tiende a ser maacutes grande qula hipoacutetesis nula es verdadera De modo que si el cociente F es demasiado grande (seguacuten lo na el nivel de significancia de la prueba y el valor apropiado de la tabla 6 del apeacutendice) rechH0 y concluimos que la regresioacuten como un todo es significativa

La figura 13-5 presenta la salida de Minitab para el problema del IRS Esta parte del rincluye los cocientes F calculados para la regresioacuten en ocasiones llamado anaacutelisis de v

(ANOVA) para la regresioacuten Probablemente se pregunte si esto tiene algo que ver con el anaacutelisrianza que estudiamos en el capiacutetulo 11 La respuesta es siacute Aunque no lo hicimos es posibletrar que el anaacutelisis de varianza visto en el capiacutetulo 11 tambieacuten contempla la variacioacuten total las observaciones alrededor de la gran media y la divide en dos partes una explicada por lascias entre los distintos grupos (que corresponde a lo que llamamos varianza entre columnas)

no explicada por dichas diferencias (que corresponde a la varianza dentro de columnas) Estcisamente anaacutelogo a lo que acabamos de hacer en la ecuacioacuten 13-11Para el problema del IRS vemos que SCR ϭ 29109 (con k ϭ 3 grados de libertad) SCE

(con n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad) y que

F ϭ ϭ ϭ 11833

Los elementos en la columna ldquoMCrdquo son justo las sumas de cuadrados divididas entre sus glibertad Para 3 grados de libertad en el numerador y 6 en el denominador la tabla 6 del apeacutence que 978 es el liacutemite superior de la regioacuten de aceptacioacuten para un nivel de significancia El valor calculado de F 11833 estaacute muy por arriba de 978 de manera que se ve que la r

como un todo es altamente significativa Se puede llegar a la misma conclusioacuten si se observresultado del programa dice que ldquo prdquo es 0000 Debido a que este valor prob es menor que elsignificancia ϭ 001 se concluye que la regresioacuten completa es significativa De esta mapuede usar la p de ANOVA como prueba sin tener que utilizar la tabla 6 del apeacutendice para bvalor criacutetico de F Esto es anaacutelogo a la manera en que se usaron los valores de p en la figura ra probar la significancia de las variables explicativas individuales

Multicolinealidad en la regresioacuten muacuteltiple

En el anaacutelisis de regresioacuten muacuteltiple los coeficientes de regresioacuten a menudo se vuelven

confiables conforme aumenta el grado de correlacioacuten entre las variables independie

existe un alto nivel de correlacioacuten entre algunas de las variables independientes nos enfrenun problema que los estadiacutesticos llaman multicolinealidad

La multicolinealidad puede presentarse si deseamos estimar la recuperacioacuten de las ventaempresa y utilizamos tanto el nuacutemero de vendedores empleados como sus salarios totales Cvalores asociados con estas dos variables independientes tienen una correlacioacuten alta neceusar soacutelo un conjunto de ellos para realizar nuestra estimacioacuten De hecho al agregar una segriable que estaacute correlacionada con la primera se distorsionan los valores de los coeficientgresioacuten Sin embargo a menudo podemos predecir bien Y incluso cuando haya multicoline

Consideremos un ejemplo donde existe multicolinealidad para ver coacutemo afecta a la regresrante los 12 meses pasados el gerente del restaurante Pizza Shack ha estado poniendo unaanuncios en el perioacutedico local Los anuncios se programan y pagan el mes anterior a que ap

Un ejemplo demulticolinealidad

Definicioacuten y efecto dela multicolinealidad

9703ᎏ

0082

29109 3ᎏ

0491 6Prueba de lasignificancia de laregresioacuten en elproblema del Serviciode Contribuciones

Anaacutelisis devarianza parala regresioacuten

Prueba F de laregresioacuten como

un todo

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 29 1088 9 7029 118 52 0Er r or 6 0 4912 0 0819Tot al 9 29 6000

FIGURA 13-5Salida de Minitabanaacutelisis devarianza

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2556

Cada anuncio contiene un cupoacuten que permite llevarse dos pizzas pagando solamente la de mcio El gerente recolectoacute los datos de la tabla 13-4 y le gustariacutea utilizarlos para predecir las vpizzas

En las figuras 13-6 y 13-7 se dieron los resultados de Minitab para las regresiones respelas ventas totales sobre el nuacutemero de anuncios y sobre el costo

Para la regresioacuten sobre el nuacutemero de anuncios tenemos que el valor t observado es 395grados de libertad y un nivel de significancia de ϭ 001 se encontroacute que el valor t criacuteticdo de la tabla 2 del apeacutendice) es 3169 Como t o Ͼ t c (o de manera equivalente como p es m001) concluimos que el nuacutemero de anuncios es una variable explicativa altamente signifilas ventas totales Note tambieacuten que r 2 ϭ 610 de modo que el nuacutemero de anuncios explximadamente el 61 de la variacioacuten en las ventas de pizzas

Para la regresioacuten sobre el costo de los anuncios el valor t observado es 454 de modo qude los anuncios es una variable explicativa de las ventas totales todaviacutea maacutes significativa que ro de anuncios (para los que el valor t observado fue soacutelo 395) En esta regresioacuten r 2 ϭ 673

el costo de los anuncios explica aproximadamente el 67 de la variacioacuten de las ventas de pizComo ambas variables explicativas son altamente significativas por siacute mismas intentam

zar ambas en una regresioacuten muacuteltiple El resultado se presenta en la figura 13-8La regresioacuten muacuteltiple es altamente significativa como un todo ya que la p de ANOVA e

Uso de ambas varia-bles explicativas enuna regresioacuten muacuteltiple

Dos regresionessimples

Datos de ventas y anun-cios para el restaurantePizza Shack

Tabla 13-4 X 1 X 2 Y

Nuacutemero Costo de anuncios Venta tode anuncios publicados de pizz

Mes publicados (cientos de doacutelares) (miles de d

Mayo 12 139 436

Junio 11 120 380

Julio 9 93 301

Agosto 7 97 353

Septiembre 12 123 464

Octubre 8 114 342

Noviembre 6 93 302

Diciembre 13 143 407

Enero 8 102 385

Febrero 6 84 226

Marzo 8 112 376

Abril 10 111 352

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esVENTAS = 16 9 + 2 08 ANUNCI OS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 16 937 4 982 3 40 0 007ANUNCI OS 2 0832 0 5271 3 95 0 003

s = 4 206 R- s q = 61 0

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 1 276 31 276 31 15 62 Er r or 10 176 88 17 69Tot a l 11 453 19

Figura 13-6

Regresioacuten de lasventas sobre elnuacutemero deanuncios conMinitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2656

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2756

gar el nuacutemero de anuncios como segunda variable explicativa ademaacutes del costo de los anuncios eplica nada maacutes alrededor del 1 adicional de la variacioacuten de las ventas totales

En este punto es justo preguntarse iquestqueacute variable realmente explica la variacioacuten de las ventotales en la regresioacuten muacuteltiple La respuesta es que ambas la explican pero no podemos separ

sus contribuciones individuales debido a que estaacuten altamente correlacionadas entre siacute E

consecuencia sus coeficientes en la regresioacuten muacuteltiple tienen errores estaacutendar altos valore

calculados relativamente bajos y valores prob Ͼ | t | relativamente altos

iquestDe queacute manera nos afecta esta multicolinealidad Todaviacutea podemos hacer predicciones relativmente precisas cuando se encuentra presente note que para la regresioacuten muacuteltiple (la salida se dala figura 13-8) el error estaacutendar de la estimacioacuten que determina el ancho de los intervalos de co

fianza para las predicciones es 3989 mientras que para la regresioacuten simple con el costo de los anucios como variable explicativa (salida en la figura 13-7) tenemos se ϭ 3849 Lo que no podemhacer es predecir con mucha precisioacuten coacutemo cambiaraacuten las ventas si aumentamos en uno el nuacutemede anuncios La regresioacuten muacuteltiple dice que b1 ϭ 0625 (esto es cada anuncio aumenta las ventotales de pizzas alrededor de $625) pero el error estaacutendar de este coeficiente es 112 (es decir apximadamente $1120)

Las contribucionesindividuales nopueden separarse

Ejercicios 134

Ejercicios de autoevaluacioacuten

EA 13-4 Edith Pratt es una ocupada ejecutiva de una compantildeiacutea de transporte de carga a nivel nacional y va tara una junta porque no encuentra la salida de la regresioacuten muacuteltiple elaborada por un asistente Si la regsioacuten total es significativa al nivel 005 ella desea usar las salida de computadora como evidencia para fudamentar algunas ideas que expondraacute en la reunioacuten Sin embargo su ayudante estaacute enfermo De hectoda la informacioacuten que tiene de la regresioacuten muacuteltiple es un trozo de papel con los siguientes datos

Regresioacuten paraEdith Pratt

SCR 8724 con gl

SCE con 17 gl

SCT 10236 con 24 gl

Como el papel ni siquiera tiene todos los nuacutemeros Edith ha concluido que no es uacutetil Usted sin embardebe saber maacutes que ella iquestPuede Edith entrar en la junta o debe seguir buscando la salida de computador

EA 13-5 Una pequentildea liacutenea aeacuterea de Nueva Inglaterra realizoacute una encuesta sobre sus 15 terminales y obtuvo losguientes datos para el mes de febrero donde

VENTAS ϭ ingreso total seguacuten el nuacutemero de boletos vendidos (en miles de doacutelares)

PROMOCϭ cantidad gastada en promociones de la liacutenea aeacuterea en el aacuterea (en miles de doacutelares)

COMPET ϭ nuacutemero de liacuteneas aeacutereas que compiten en esa terminal

GRATIS ϭ nuacutemero de pasajeros que vuelan gratis (por diferentes razones)

Sugerencia el concepto de hacer infe-rencias respecto a una regresioacuten muacutelti-ple es justo lo mismo que se hizo en elcapiacutetulo 12 cuando hicimos inferencias

respecto a una recta de regresioacuten excepto que ahora se em-

plean dos o maacutes variables independientes Advertencia lamulticolinealidad es un problema que debe manejarse enla regresioacuten muacuteltiple y es necesario desarrollar una com-prensioacuten con sentido comuacuten Recuerde que todaviacutea puedehacer predicciones precisas cuando estaacute presente Pero re-cuerde tambieacuten que no puede decir con mucha precisioacuten

cuaacutento cambiaraacute la variable dependiente si ldquomanipulardquo lavariables independientes Entonces el objetivo debe seminimizar la multicolinealidad Sugerencia la mejor regresioacuten muacuteltiple es la que explica la relacioacuten entre los datos asentildealar la responsabilidad de la mayor proporcioacuten de la va

riacioacuten en la variable dependiente con el menor nuacutemero dvariables independientes Advertencia no es una buenidea incluir demasiadas variables independientes soacutelo porque cuenta con una computadora y un paquete de softwarpara estadiacutestica

SUGERENCIAS

Y

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2856

Ventas (doacutelares) Promoc (doacutelares) Compet Gratis

793 25 10 3

2001 55 8 6

1632 60 12 9

2001 79 7 16

1460 52 8 15

1777 76 12 9

309 20 12 8

2919 90 5 10

1600 40 8 43394 96 5 16

1596 55 11 7

863 30 12 6

2375 60 6 10

1072 50 10 4

1550 35 10 4

a) Utilice la siguiente salida de Minitab para determinar la ecuacioacuten de regresioacuten que mejor se ara la liacutenea aeacuterea

La ec uaci oacuten de r egr es i oacuten esVENTAS ϭ 172 ϩ 25 9 PROMOVϪ 13 2 COMPET Ϫ 3 04 GRATI S

Pr onos t i cador Coef Des vEs t Coci ent e - t Cons t ant e 172 34 51 38 3 35 0PROMOV 25 950 4 877 5 32 0COMPET - 13 238 3 686 - 3 59 0GRATI S - 3 041 2 342 - 1 30 0

b) iquestLos pasajeros que vuelan gratis ocasionan una disminucioacuten significativa en las ventas Fpruebe las hipoacutetesis apropiadas Use ϭ 005

c) iquestUn incremento de $1000 en las promociones cambia las ventas en $28000 o el cambio ecativamente diferente de $28000 Formule y pruebe las hipoacutetesis adecuadas Use ϭ 010

d) Calcule un intervalo de confianza del 90 para el coeficiente de la pendiente de la COMPET

Aplicaciones

13-22 Mark Lowtown publica el perioacutedico Mosquito Junction Enquirer y tiene problemas para predectidad de papel perioacutedico que necesita imprimir diariamente Eligioacute aleatoriamente 27 diacuteas del arior y registroacute la siguiente informacioacuten

PESO ϭ peso en libras de papel perioacutedico para la edicioacuten de ese diacutea

CLASIFICADOS ϭ nuacutemero de anuncios clasificados

PUBLICIDAD ϭ nuacutemero de anuncios publicitarios

PLANA COMPLETA ϭ nuacutemero de anuncios a una plana

Utilizando Minitab para hacer una regresioacuten de PESO sobre las otras tres variables Mark obtuguiente salida

Pr onos t i cador Coef Des vEs t Coci ent e- t Cons t ant e 1072 95 872 43 1 23 0CLASI FI CADOS 0 251 0 126 1 99 0PUBLI CI DAD 1 250 0 884 1 41 0PLANA COMPLETA 250 66 67 92 3 69 0

a) Mark siempre ha pensado que cada anuncio publicitario utiliza al menos 3 libras de papel iquestsioacuten le da una razoacuten significativa para dudar esto al nivel del 5

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2956

b) De manera similar Mark siempre ha creiacutedo que cada anuncio clasificado utiliza aproximmedia libra de papel iquestTiene ahora Mark una razoacuten significativa para dudar esto al nivel del

c) Mark vende espacios de anuncios de plana completa a los comerciantes locales a $30 la paacutegberaacute pensar en ajustar sus tarifas si el papel perioacutedico le cuesta $009 por libra Suponga costos son despreciables Establezca expliacutecitamente las hipoacutetesis y una conclusioacuten (Sugere

jando todo lo demaacutes constante cada anuncio adicional de plana completa tiene un costo de bras de papel ϫ $009 por libra ϭ $2256 El punto de equilibrio es 333333 libras iquestPor quel coeficiente de pendiente para PLANA COMPLETA es significativamente mayor que Mark no estaacute obteniendo ganancias y debe cambiar sus tarifas)

13-23 Para los datos del ejercicio 13-18 y un nivel de significancia de 010 iquestcuaacuteles variables son sign

mente explicativas de los resultados de los exaacutemenes (Habiacutea 12 estudiantes en la muestra) 13-24 Para los datos del ejercicio 13-18 y la siguiente salida de Minitab del procedimiento de regresiple hecho por Bill

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 3134 42 783 60Er r or 7 951 25 135 89Tot a l 11 4085 67

a) iquestCuaacutel es el valor observado de F b) A un nivel de significancia de 005 iquestcuaacutel es el valor criacutetico de F que se debe utilizar para d

si la regresioacuten como un todo es significativac) Basaacutendose en las respuestas a los incisos a) y b) iquestes la regresioacuten significativa como un tod

13-25 Remiacutetase al ejercicio 13-19 A un nivel de significancia de 001 iquestes la variable DISTANCIA uble explicativa significativa para VENTAS

13-26 Para los datos del ejercicio 13-19 y la siguiente salida adicional de Minitab al correr la regresioacuten

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 2861495 715374 102 39 0Er r or 18 125761 6896 7Tot a l 22 2987256

Al nivel de significancia de 005 iquestes la regresioacuten significativa como un todo

13-27 Henry Lander es el director de produccioacuten de la Alecos Corporation de Caracas Venezuela Hede que le ayude a determinar una foacutermula para predecir el ausentismo de los empacadores de chipoacutetesis es que la temperatura diaria promedio puede explicar el porcentaje de ausentismo Durios meses reuacutene datos ejecuta el procedimiento de regresioacuten simple y encuentra que la tempeplica 66 de la variacioacuten en el ausentismo Pero Henry no estaacute convencido de que eacuteste sea un cador satisfactorio Sugiere que la precipitacioacuten pluvial diaria podriacutea tambieacuten tener algo que vausentismo de modo que registra los datos correspondientes y hace una regresioacuten del ausentismte el tiempo de lluvias y obtiene un valor R2 de 059 ldquoiexclEurekardquo grita usted ldquoiexclLo tengo Con uticador que explica 66 y otro que explica 59 todo lo que tengo que hacer es una regresioacutenutilizando ambos y seguramente tendreacute un pronosticador casi perfectordquo Para su desaacutenimo sin la regresioacuten muacuteltiple tiene una R

2 de soacutelo 68 que es solamente un poco mejor que la variablperatura sola iquestCoacutemo puede explicar esta aparente discrepancia

13-28 Juan Armenlegg administrador de Rockyrsquos Diamond y Jewelry Store estaacute interesado en desamodelo para estimar la demanda del consumidor para su costosa mercanciacutea Como la mayoriacutea de

tes compran diamantes y joyas a creacutedito Juan estaacute seguro de que dos factores que deben influirmanda de los clientes son la tasa real de inflacioacuten anual y la tasa real de intereses sobre preacutestamprincipales bancos del paiacutes Explique algunos problemas que Juan podriacutea encontrar si fuera a dun modelo de regresioacuten basado en estas dos variables de prediccioacuten

13-29 Un nuevo programa de juegos Check That Model pide a los concursantes que especifiquen el nuacutenimo de paraacutemetros que necesitan para determinar si un modelo de regresioacuten muacuteltiple es signifimo un todo para ϭ 001 Usted ganoacute la apuesta con 4 paraacutemetros Use la siguiente informacioacutenterminar si la regresioacuten es significativa

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3056

R 2

ϭ 07452

SCE ϭ 1254

n ϭ 18

Nuacutemero de variables independientes ϭ 3

13-30 La Scottish Turist Agency estaacute interesada en el nuacutemero de turistas que entran al paiacutes cada semanrante la temporada alta Se recolectaron los siguientes datos

Turistas (Y ) ϭ nuacutemero de turistas que entran a Escocia en una semana (en miles)

Cambio (X 1)ϭ nuacutemero de libras escocesas compradas por $1 doacutelar

Precio (X 2) ϭ nuacutemero de libras escocesas cobradas por viaje redondo en camioacuten de Londres a Edimburgo

Promoc (X 3) ϭ cantidad gastada en promocioacuten del paiacutes (en miles de libras escocesas)Temp (X 4) ϭ temperatura media durante la semana en Edimburgo (en grados Celsius)

Turistas (Y ) Cambio (X 1) Precio (X 2) Promoc (X 3) Temp (X 4)

69 061 40 87 154

71 059 40 88 156

68 063 40 85 154

79 061 35 86 153

76 060 35 94 158

82 065 35 99 162

80 058 35 98 164

84 059 35 102 166

97 061 30 114 174

98 062 30 116 172

72 057 40 84 176

67 055 40 86 164

a) Utilice el paquete de software que tenga para determinar la ecuacioacuten de regresioacuten que mejote a los datos de la agencia de turismo

b) iquestEs la tasa de cambio una variable explicativa significativa Establezca y pruebe las hipoacutetesidas a un nivel de significancia de 010

c) Un incremento de 1000 libras en las promociones iquestaumenta el nuacutemero de turistas en maacutesEstablezca y pruebe las hipoacutetesis adecuadas para un nivel de significancia de 005

d) Calcule un intervalo de confianza del 95 para el coeficiente de la pendiente de Temp

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-4 Como SCT ϭ SCR ϩ SCE SCE ϭ SCT Ϫ SCR ϭ 10236 Ϫ 8724 ϭ 1512Como gl SCT ϭ gl SCR ϩ gl SCE gl SCR ϭ gl SCT Ϫ gl SCE ϭ 24 Ϫ 17 ϭ 7

Entonces F ϭ ϭ ϭ 1401

F CRiacuteT ϭ F (7 17 005) ϭ 261Como F OBS gt F CRIacuteT se concluye que la regresioacuten es significativa como un todo Edith debe conticando la salida de computadora de la regresioacuten para usarla en la junta

EA 13-5 De la salida de computadora se obti enen los siguientes resultadosa) VENTAS ϭ 17234 ϩ 25950PROMOC Ϫ13238COMPET Ϫ 3041GRATISb) H0 BGRATIS ϭ 0 H1 BGRATIS Ͻ 0 ϭ 005

Eacutesta es una prueba de una cola y el valor prob en los resultados es para la alternativa de dos c BGRATIS 0 De manera que para esta prueba el valor prob es 02212 ϭ 0111 Ͼ ϭ 00que no se puede rechazar H0 las ventas no disminuyen significativamente cuando aumenta ro de pasajeros que vuelan gratis

c) H0 BPROMOC ϭ 28 H1 BPROMOC 28 ϭ 010

87247ᎏᎏ

151217SCRk ᎏᎏ

SCE(n Ϫ k Ϫ 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3156

El valor observado t de los resultados de regresioacuten es

ϭ ϭ Ϫ0420

Con 11 grados de libertad y ϭ 010 en ambas colas combinadas los valores criacuteticos t parba son Ϯ1796 asiacute el valor observado estaacute dentro de la regioacuten de aceptacioacuten No se rechacambio en VENTAS para un incremento de una unidad ($1000) en PROMOC no es significate diferente de 28 ($28000)

d) Con 11 grados de libertad el valor t para un intervalo del 90 de confianza es 1796 por lo

tervalo esbCOMP Ϯ 1796sbCOMP

ϭ Ϫ13238 Ϯ 1796(3686)

ϭ Ϫ13238 Ϯ 6620 ϭ (Ϫ19858 Ϫ 6618)

La liacutenea aeacuterea puede tener una seguridad del 90 de que el ingreso por los boletos en una ofminuye entre $6600 y $19900 aproximadamente con cada liacutenea aeacuterea adicional que comp

135 Teacutecnicas de modelado

Dada una variable que deseamos explicar y un conjunto de variables explicativas potencialehaya varias ecuaciones de regresioacuten diferentes que podamos estudiar dependiendo de queacute explicativas incluyamos y de coacutemo lo hagamos Cada una de esas ecuaciones de regresioacutence como modelo Las teacutecnicas de modelado son las distintas formas en que podemos incluriables explicativas y verificar queacute tan apropiados son los modelos de regresioacuten Existen municas de modelado diferentes pero soacutelo veremos dos de las maacutes utilizadas

Datos cualitativos y variables ficticias

En todos los ejemplos de regresioacuten que hemos visto hasta ahora los datos manejados hanmeacutericos o cuantitativos Pero ocasionalmente nos enfrentaremos con una variable categoacuterilitativa En el problema del inicio el capiacutetulo el director de personal desea ver si el salarioun vendedor depende de su sexo En la tabla 13-5 repetimos los datos de dicho problema

Por el momento ignore la antiguumledad y utilice la teacutecnica desarrollada en el capiacutetulo 9 bar la diferencia entre las medias de dos poblaciones para ver si los hombres ganan maacutes qu

jeres Pruebe con ϭ 001 Si tomamos a los hombres como la poblacioacuten 1 y a las mujerespoblacioacuten 2 probaremos las siguientes hipoacutetesis

H0 1 ϭ 2 larr Hipoacutetesis nula no existe discriminacioacuten por sexo en los salarios base

H1 1 Ͼ 2 larr Hipoacutetesis alternativa se discrimina a las mujeres en su salario base

ϭ 001 larr Nivel de significancia

Revisioacuten del enfoqueanterior del problema

Buacutesqueda dediferentes modelos

25950 Ϫ 28ᎏᎏ

4877

(bPROMOC Ϫ 28)ᎏᎏ

sbPROMOC

Datos para el problemade discriminacioacuten porsexo

Tabla 13-5 Vendedores VendedorasAntiguumledad Salario base Antiguumledad Salario base(en meses) (en miles) (en meses) (en miles)

6 75 5 62

10 86 13 87

12 91 15 94

18 103 21 98

30 130

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3256

A continuacioacuten bosquejamos el anaacutelisis Si tiene problemas para seguirlo deberaacute repasamente la seccioacuten 93

n1 ϭ 5 n2 ϭ 4

x ෆ1 ϭ 97 x ෆ2 ϭ 8525

s2

1 ϭ 4415 s2

2 ϭ 2609

s2

p ϭ

ϭ

ϭ 3641

x ෆ1Ϫ x

ෆ2ϭ s pΊ ϩ

ϭ 128

t ϭ

ϭ

ϭ 092

Con siete grados de libertad el valor t criacutetico para una prueba de cola superior con ϭ 001 eComo el valor t observado de 092 es menor que 2998 no podemos rechazar H0

Entonces el anaacutelisis concluye que no parece haber discriminacioacuten por sexo en los salarPero recuerde que hasta ahora se han ignorado los datos de antiguumledad laboral para el anaacuteli

Antes de seguir vea el diagrama de dispersioacuten de los datos En la figura 13-9 los punto

corresponden a los hombres y los blancos a las mujeres El diagrama de dispersioacuten muestraridad que el salario base aumenta con los antildeos de antiguumledad pero si con la mirada sigue lo qla recta de regresioacuten notaraacute que los puntos negros tienden a estar arriba de ella y los blancos

La figura 13-10 da la salida de una regresioacuten del salario base sobre los meses de antiguumlelos resultados se ve que la antiguumledad es una variable explicativa altamente significativa

Ademaacutes r 2

ϭ 926 que indica que la variable meses de antiguumledad explica cerca del 9variacioacuten en el salario base La figura 13-11 contiene parte de la salida que no se vio antesbla de residuos Para cada punto el residuo es simplemente Y Ϫ Y ˆ que se reconoce como el

Una ldquomiradardquo a los

datos

El enfoque anterior nodetecta discriminacioacuten

(97 ndash 8525) ndash 0ᎏᎏ

128

( x ෆ1 ndash x ෆ2) ndash (1 Ϫ 2)H0

ᎏᎏᎏ

ˆ x ෆ1Ϫ

x ෆ2

1ᎏ

n2

1ᎏ

n1

4(4415) ϩ 3(2609)ᎏᎏᎏ5 ϩ 4 ndash 2

(n1 ndash 1)s21 ϩ (n2 ndash 1)s22ᎏᎏᎏ

n1 ϩ n2 ndash 2

FIGURA 13-9

Diagrama de dis-persioacuten de salariosbase contra mesesde antiguumledad

4 8 12 16 20 24 28

4

8

12

Meses de antiguumledad

S a l a r i o ( m i l e s d e d oacute l a r e s )

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3356

el ajuste de la recta de regresioacuten en ese punto En la figura 13-11 AJUST1 son los valores y RESI1 son los residuos

Tal vez la parte maacutes importante del anaacutelisis del resultado de una regresioacuten sea estusiduos Si la regresioacuten incluye todos los factores explicativos relevantes estos residuo

ser aleatorios Dicho de otro modo si los residuos muestran cualquier patroacuten no aleat

to indica que hay algo sistemaacutetico que afecta el proceso y que no hemos tomado en cu

manera que buscamos patrones en los residuos o para decirlo de forma maacutes pintoresca ldquopmos a los residuos hasta hacerlos hablarrdquo

Si observamos los residuos presentados en la figura 13-11 vemos que los primeros cincoson positivos De modo que para los vendedores tenemos Y ndash Y ˆ Ͼ 0 o Y Ͼ Y ˆ es decir laregresioacuten cae abajo de estos cinco puntos Tres de los cuatro uacuteltimos residuos son negaticonsiguiente para las vendedoras tenemos Y Ϫ Y ˆ Ͻ 0 o Y Ͻ Y ˆ asiacute que la recta de regresicuentra arriba de tres de los cuatro puntos Esto confirma lo que vimos al observar el diagdispersioacuten de la figura 13-9 Este patroacuten no aleatorio en los residuos sugiere que el sexo siacute etor determinante del salario base

iquestCoacutemo podemos incorporar el sexo de los vendedores dentro del modelo de regresioacutencemos utilizando un dispositivo llamado variable ficticia (o variable indicadora) Para lpuntos que representan a los vendedores esta variable tiene valor de 0 y para los cuatro purepresentan a las vendedoras valdraacute 1 Los datos de entrada para nuestra regresioacuten con variticias se dan en la tabla 13-6

Para los datos de la tabla 13-6 se ajusta una regresioacuten de la forma

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

Uso de variablesficticias

Deteccioacuten depatrones en losresiduos

ldquoPresionar a losresiduosrdquo

Anaacutel i s i s de r e gr e s i oacuten

La ec uac i oacuten de r e gr es i oacuten esSALARI O ϭ 5 81 ϩ 0 233 MESES

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t pCons t a nt e 5 8093 0 4038 14 39 0 000MESES 0 23320 0 02492 9 36 0 000

s ϭ 0 5494 R- s q ϭ 92 6

Anaacute l i s i s de va r i a nz aFUENTE GL SC MC F Re gr e s i oacuten 1 26 443 24 443 87 61 0Er r or 7 2 113 0 302Tot a l 8 28 556

FIGURA 13-10

Regresioacuten conMinitab del salariobase sobre losmeses deantiguumledad

RENGLOacuteN SALARI O AJ UST1 RESI 1

1 7 5 7 2085 0 2914992 8 6 8 1413 0 458684

3 9 1 8 6077 0 4922764 10 3 10 0069 0 2930545 13 0 12 8054 0 1946076 6 2 6 9753 - 0 7752977 8 7 8 8409 - 0 1409288 9 4 9 3073 0 0926649 9 8 10 7066 - 0 906558

FIGURA 13-11

Tabla de residuosde Minitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 356

En este capiacutetulo veremos coacutemo encontrar la ecuacioacuten de regresioacuten de mejor ajuste para un co junto dado de datos y coacutemo analizar la ecuacioacuten obtenida Aunque mostraremos coacutemo se puede hcer regresioacuten muacuteltiple a mano o con una calculadora pronto seraacute evidente que no conviene hacersiquiera un problema real pequentildeo a mano Afortunadamente hay muchos paquetes de software dponibles para hacer regresiones muacuteltiples y otros anaacutelisis estadiacutesticos Estos paquetes realizan ldquooperaciones numeacutericasrdquo y lo dejan libre para concentrarse en el anaacutelisis del significado de la ecucioacuten de estimacioacuten resultante

La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacuteccas de variables ficticias podemos incluir factores cualitativos tales como el sexo en nuestra regsioacuten muacuteltiple Esta teacutecnica nos permitiraacute analizar el problema de discriminacioacuten con que abrimos

presente capiacutetulo Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutenicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de nuetras ecuaciones de estimacioacuten

Paquetes de softwarepara regresioacuten

Ejercicios 131

Conceptos baacutesicos

13-1 iquestPor queacute utilizamos regresioacuten muacuteltiple en lugar de regresioacuten simple al estimar una variable dependien 13-2 iquestDe queacute manera se utilizaraacuten las variables ficticias en nuestro estudio de regresioacuten muacuteltiple

13-3 iquestA queacute se refiere la palabra muacuteltiple en la frase regresioacuten muacuteltiple 13-4 La duentildea de una cadena de almacenes desea predecir las ventas mensuales a partir del tamantildeo de la cdad donde se localiza una tienda Despueacutes de ajustar un modelo de regresioacuten simple decide que deincluir el efecto de la temporada del antildeo en el modelo iquestSe puede hacer esto utilizando las teacutecnicas del prsente capiacutetulo

13-5 Describa los tres pasos del proceso de anaacutelisis de regresioacuten muacuteltiple y correlacioacuten 13-6 iquestLos procedimientos utilizados en la regresioacuten muacuteltiple difieren mucho de los usados en regresioacuten si

ple Explique su respuesta

132 Deduccioacuten de la ecuacioacutende regresioacuten muacuteltiple

Veamos coacutemo podemos calcular la ecuacioacuten de regresioacuten muacuteltiple Por conveniencia utilizaremsoacutelo dos variables independientes en el problema que trabajaremos en esta seccioacuten Sin embargtenga en mente que en principio la misma clase de teacutecnica se aplica a cualquier nuacutemero de variabindependientes

El Servicio Interno de Contribuciones (IRS Internal Revenue Service) de Estados Unidos etratando de estimar la cantidad mensual de impuestos no pagados descubiertos por su departamende auditoriacuteas En el pasado el IRS estimaba esta cantidad con base en el nuacutemero esperado de horastrabajo de auditoriacuteas de campo En los uacuteltimos antildeos sin embargo las horas de trabajo de auditorde campo se han convertido en un pronosticador erraacutetico de los impuestos no pagados reales Comresultado la dependencia estaacute buscando otro factor para mejorar la ecuacioacuten de estimacioacuten

El departamento de auditoriacuteas tiene un registro del nuacutemero de horas que usa sus computador

para detectar impuestos no pagados iquestPodriacuteamos combinar esta informacioacuten con los datos referetes a las horas de trabajo de auditoriacuteas de campo y obtener una ecuacioacuten de estimacioacuten maacutes precpara los impuestos no pagados descubiertos cada mes En la tabla 13-1 se presentan esos datos pra los uacuteltimos 10 meses

En la regresioacuten simple X es el siacutembolo utilizado para los valores de la variable independiente En

regresioacuten muacuteltiple tenemos maacutes de una variable independiente Entonces seguiremos usando X pero ag

garemos un subiacutendice (por ejemplo X 1 X 2) para diferenciar cada una de las variables independientes

Siacutembolos adecuados

Un problema queilustra la regresioacutenmuacuteltiple

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 456

En este problema X 1 representa el nuacutemero de horas de trabajo de auditoriacutea de campo y X 2 el nuacute-mero de horas en computadora La variable dependiente Y seraacute los impuestos reales no pagados des-cubiertos

Recuerde que en la regresioacuten simple la ecuacioacuten de estimacioacuten Y ˆ ϭ a ϩ bX describe la relacioacutenentre las dos variables X y Y En regresioacuten muacuteltiple debemos extender esa ecuacioacuten agregando unteacutermino para cada nueva variable En siacutembolos la ecuacioacuten 13-1 es la foacutermula que se usa cuando te-nemos dos variables independientes

Ecuacioacuten deestimacioacuten pararegresioacuten muacuteltiple

Definicioacuten de lasvariables

Datos de los registros deauditoriacuteas del IRS de losuacuteltimos 10 meses

Tabla 13-1 X 1 X 2 Y

Horas de trabajo de Horas en Impuestos realesauditoriacutea de campo computadora no pagados descubiertos

Mes (dos ceros omitidos) (dos ceros omitidos) (millones de doacutelares)

Enero 45 16 29

Febrero 42 14 24

Marzo 44 15 27

Abril 45 13 25

Mayo 43 13 26

Junio 46 14 28

Julio 44 16 30Agosto 45 16 28

Septiembre 44 15 28

Octubre 43 15 27

Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 [13-1]

Ecuaciones normales

Y ϭ na ϩ b1 X 1 ϩb2 X 2 [13-2]

X 1Y ϭ a X 1 ϩ b1 X 2

1 ϩb2 X 1 X 2 [13-3]

X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩb2 X 2

2 [13-4]

donde

bull Y ˆ ϭ valor estimado correspondiente a la variable dependientebull a ϭ ordenada Y

bull X 1 y X 2 ϭ valores de las dos variables independientesbull b1 y b2 ϭ pendientes asociadas con X 1 y X 2 respectivamente

Podemos visualizar la ecuacioacuten de estimacioacuten simple como una recta en una graacutefica de manerasimilar podemos representar una ecuacioacuten de regresioacuten muacuteltiple de dos variables como un plano

como el que ilustra la figura 13-1 Se trata de una forma o figura tridimensional con profundidadlargo y ancho Para obtener una idea intuitiva de esta forma tridimensional visualice la interseccioacutende los ejes Y X 1 y X 2 como un rincoacuten de una habitacioacuten

La figura 13-1 es una graacutefica de los 10 puntos de la muestra y el plano alrededor del cual estospuntos parecen agruparse Algunos estaacuten arriba del plano y otros abajo del mismo modo que los pun-tos estaban arriba y abajo de la recta de regresioacuten simple

Nuestro problema consiste en decidir cuaacutel de los planos que podemos dibujar seraacute el que mejorse ajuste Para hacer esto de nuevo utilizaremos el criterio de miacutenimos cuadrados y localizaremosel plano que minimice la suma de los cuadrados de los errores es decir de las distancias de los pun-tos alrededor del plano a los puntos correspondientes sobre el plano Usemos nuestros datos y las si-guientes tres ecuaciones para determinar los valores de las constantes numeacutericas a b1 y b2

Uso del criterio demiacutenimos cuadradospara ajustar un planode regresioacuten

Visualizacioacuten de laregresioacuten muacuteltiple

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 556

Error Punto correspondienteen el plano

Punto observado

Plano formado a traveacutesde los puntos de la muestraY = a + b 1X 1 + b 2X 2^

a = ordenada Y

X 1

X 2

Y FIGURA 13-1

Plano de regresioacutenmuacuteltiple para 10datos

Podemos obtener a b1 y b2 los coeficientes del plano de regresioacuten resolviendo las ec13-2 13-3 y 13-4 Obviamente la mejor manera de calcular todas las sumas implicadas en ecuaciones es elaborar una tabla para recolectar y organizar la informacioacuten necesaria comen la regresioacuten simple Esto se presenta en la tabla 13-2 para el problema del IRS

Ahora utilizando la informacioacuten de la tabla 13-2 en las ecuaciones 13-2 13-3 y 13-4 obtres ecuaciones con tres constantes desconocidas (a b1 y b2)

272 ϭ 10a ϩ 441b1 ϩ 147b2

12005 ϭ 441a ϩ 19461b1 ϩ 6485b2

4013 ϭ 147a ϩ 6485b1 ϩ 2173b2

Cuando resolvemos estas tres ecuaciones de manera simultaacutenea obtenemos

a ϭ Ϫ13828

b1 ϭ Ϫ 0564

b2 ϭ Ϫ 1099

Sustituyendo estos tres valores en la ecuacioacuten de regresioacuten de dos variables (ecuacioacuten 13-l)mos una ecuacioacuten que describe la relacioacuten entre el nuacutemero de horas de trabajo en auditoriacuteaspo el nuacutemero de horas de computacioacuten y los impuestos no pagados descubiertos por el dep

to de auditoriacuteasY ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

ϭ Ϫ13828 ϩ 0564 X 1 ϩ 1099 X 2

El departamento de auditoriacuteas puede utilizar esta ecuacioacuten mensualmente para estimardad de impuestos no pagados que va a descubrir

Suponga que el IRS desea aumentar la cantidad de detecciones de impuestos no pagados ete mes Como los auditores capacitados son escasos el IRS no tiene la intencioacuten de contratnal adicional El nuacutemero de horas de trabajo en auditoriacuteas entonces permaneceraacute en el niv

Uso de la ecuacioacutende regresioacuten muacuteltiplepara estimaciones

Obtencioacuten de a b 1y b 2 resolviendo lasecuaciones 13-213-3 y 13-4

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 656

tubre alrededor de 4300 horas Pero con el fin de aumentar las detecciones de impuestos no p

el IRS espera aumentar el nuacutemero de horas en computadora a cerca de 1600 Como resultad X 1 ϭ 43 larr 4300 horas de trabajo en auditoriacuteas de campo

X 2 ϭ 16 larr 1600 horas de tiempo en computadora

Sustituyendo estos valores en la ecuacioacuten de regresioacuten para el departamento de auditoriacuteanemos

Y ˆ ϭ Ϫ13828 ϩ 0564 X 1 ϩ 1099 X 2

Y ˆ ϭ Ϫ13828 ϩ (0564)(43) ϩ (1099)(16)

Y ˆ ϭ Ϫ13828 ϩ 24252 ϩ 17584

Y ˆ ϭ 28008 larr Detecciones estimadas de $28008000

Por tanto en el pronoacutestico para noviembre el departamento de auditoriacuteas espera enconevasioacuten de impuestos cercana a 28 millones de doacutelares para esta combinacioacuten de factores

Hasta este punto nos hemos referido a a como la ordenada Y y a b1 y b2 como las pendieplano de regresioacuten muacuteltiple Pero para ser maacutes precisos debemos decir que estas constantericas son los coeficientes de regresioacuten estimados La constante a es el valor de Y ˆ (en este catimacioacuten de los impuestos no pagados) si tanto X 1 como X 2 tienen valor cero Los coeficienb2 describen coacutemo los cambios en X 1 y X 2 afectan el valor de Y ˆ En el ejemplo del IRS pode

jar constante el nuacutemero de horas de trabajo de auditoriacutea de campo X 1 y cambiar el nuacutemerras en computadora X 2 Cuando hacemos esto el valor de Y ˆ aumenta en $1099000 por choras adicionales de tiempo en computadora Del mismo modo podemos fijar X 2 y encon

por cada aumento adicional de 100 horas en el nuacutemero de horas de trabajo de auditoriacuteas deY ˆ aumenta $564000

a b 1 y b 2 son loscoeficientes de re-gresioacuten estimados

Interpretacioacuten de laestimacioacuten

Sugerencia si tiene problemas para vi-sualizar lo que hace en realidad la regre-sioacuten muacuteltiple piense en el capiacutetulo 12 yrecuerde que una recta de regresioacuten des-

cribe la relacioacuten entre dos variables En la regresioacuten muacutelti-ple el plano de regresioacuten como el que se ve en la paacuteginaanterior describe la relacioacuten entre tres variables Y X 1 y X 2El concepto del plano de regresioacuten adecuado es el mismo

que el de la recta de regresioacuten adecuada es decir el qnimiza la suma de los cuadrados de las distancias vles entre los puntos de los datos y el plano en este cavez sea uacutetil recordar que cada variable independienteser responsable de cierta variacioacuten en la variable diente La regresioacuten muacuteltiple es soacutelo una manera dvarias variables independientes para hacer un promejor de la variable dependiente

SUGERENCIAS

Y

SUPOSICIONES

Valores para ajustarel plano de miacutenimoscuadrados donden ϭ 10

Tabla 13-2 Y X 1 X 2 X 1Y X 2Y X 1Y 2 X 2

1 X 2

2

(1) (2) (3) (2) ϫ (1) (3) ϫ (1) (2) ϫ (3) (2)2 (3)2

29 45 16 1305 464 720 2025 256

24 42 14 1008 336 588 1764 196

27 44 15 1188 405 660 1936 225

25 45 13 1125 325 585 2025 169

26 43 13 1118 338 559 1849 169

28 46 14 1288 392 644 2116 196

30 44 16 1320 480 704 1936 256

28 45 16 1260 448 720 2025 256 28 44 15 1232 420 660 1936 225

27 43 15 1161 405 645 1849 225

272 441 147 12005 4013 6485 19461 2173 7uarr uarr uarr uarr uarr uarr uarr uarr

Y X 1 X 2 X 1Y X 2Y X 1X 2 X 21 X 22

Y ෆ ϭ 272

X ෆ1 ϭ 441

X ෆ2 ϭ 147

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 756

Ejercicios 132

Ejercicios de autoevaluacioacutenEA 13-1 Dado el siguiente conjunto de datos

a) Calcule el plano de regresioacuten muacuteltipleb) Prediga Y cuando X 1 ϭ 30 y X 2 ϭ 27

Y X 1 X 2

25 35 50

30 67 4211 15 85

22 03 14

27 46 36

19 20 13

EA 13-2 Se ha reunido la siguiente informacioacuten de una muestra aleatoria de arrendadores de departamentos en uciudad Se intenta predecir la renta (en doacutelares por mes) con base en el tamantildeo del departamento (nuacutemro de habitaciones) y la distancia al centro de la ciudad (en millas)

Renta Nuacutemero de Distancia(doacutelares) habitaciones al centro

360 2 1

1000 6 1450 3 2

525 4 3

350 2 10

300 1 4

a) Calcule la ecuacioacuten de miacutenimos cuadrados que relacione mejor estas tres variablesb) Si alguien busca un departamento de dos habitaciones a 2 millas del centro iquestqueacute renta debe esperar pag

Conceptos baacutesicos 13-7 Dado el siguiente conjunto de datos

a) Calcule el plano de regresioacuten muacuteltipleb) Pronostique Y cuando X 1 ϭ 105 y X 2 ϭ 136

Y X 1 X 2

114 45 132

166 87 187

205 126 198

294 197 254

76 29 228

138 67 178

285 174 146

13-8 Para el siguiente conjunto de datosa) Calcule el plano de regresioacuten muacuteltipleb) Prediga Y cuando X 1 ϭ 28 y X 2 ϭ 10

Y X 1 X 2

10 8 4

17 21 9

18 14 11

26 17 20

35 36 13

8 9 28

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 856

13-9 Dado el siguiente conjunto de datosa) Calcule el plano de regresioacuten muacuteltipleb) Pronostique Y cuando X 1 ϭ Ϫ1 y X 2 ϭ 4

Y X 1 X 2

6 1 3

10 3 Ϫ1

9 2 4

14 Ϫ2 7

7 3 2

5 6 Ϫ4

Aplicaciones

13-10 Sam Spade duentildeo y gerente general de Stationery Store estaacute preocupado por el comportamienventas de un modelo de reproductor de CD y casetes que se venden en la tienda Se da cuenta de ten muchos factores que podriacutean ayudar a explicarlo pero cree que la publicidad y el precio soncipales determinantes Sam reunioacute los siguientes datos

Ventas Publicidad Precio(unidades vend) (nuacutem de anuncios) (doacutelares)

33 3 125

61 6 115

70 10 140

82 13 130

17 9 145

24 6 140

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir las ventas a partir de la publicidad y b) Si la publicidad es 7 y el precio es $132 iquestqueacute ventas podriacutea pronosticar

13-11 Un productor de comida para cerdos desea determinar queacute relacioacuten existe entre la edad de un cerdo empieza a recibir un complemento alimenticio de reciente creacioacuten el peso inicial del anima

mento de peso en un periodo de una semana con el complemento alimenticio La siguiente infoes resultado de un estudio de ocho lechones

X 1 X 2 Y

Nuacutemero Peso inicial Edad inicial Aumentode lechoacuten (libras) (semanas) de peso

1 39 8 7

2 52 6 6

3 49 7 8

4 46 12 10

5 61 9 9

6 35 6 5

7 25 7 38 55 4 4

a) Calcule la ecuacioacuten de miacutenimos cuadrados que mejor describa estas tres variablesb) iquestCuaacutento podemos esperar que un cerdo aumente de peso en una semana con el complemento

ticio si teniacutea nueve semanas de edad y pesaba 48 libras 13-12 Una estudiante graduada que quiere comprar un auto Neptune usado investigoacute los precios Pien

antildeo del modelo y el nuacutemero de millas recorridas influyen en el precio de compra Los datos siguirresponden a 10 autos con precio (Y ) en miles de doacutelares antildeo ( X 1) y millas recorridas ( X 2) en ma) Encuentre (calcule) la ecuacioacuten de miacutenimos cuadrados que mejor relacione estas tres variabb) La estudiante desea comprar un Neptune 1991 con alrededor de 40000 millas recorridas

pronostica que pagaraacute

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 956

(Y ) X 2

Precio X 1 Millas(miles de doacutelares) Antildeo (miles)

299 1987 556

602 1992 184

887 1993 213

392 1988 469

955 1994 118

905 1991 364

937 1992 282

42 1988 44248 1989 349

574 1991 264

13-13 La Reserva Federal de Estados Unidos realiza un estudio preliminar para determinar la relacioacuten etos indicadores econoacutemicos y el cambio porcentual anual en el producto interno bruto (PIB) Dindicadores examinados son el monto del deacuteficit del gobierno federal (en miles de millones de del promedio industrial Dow Jones (el valor medio del antildeo) Los datos correspondientes a seis antilde

Y X 1 X 2

Cambio en el PIB Deacuteficit federal Dow Jones

25 100 2850

Ϫ10 400 2100

40 120 330010 200 2400

15 180 2550

30 80 2700

a) Encuentre (calcule) la ecuacioacuten de miacutenimos cuadrados que mejor describa los datosb) iquestQueacute porcentaje de cambio en el PIB se esperariacutea en un antildeo en el cual el deacuteficit federal fue

millones de doacutelares y el promedio Dow Jones fue 3000

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-1 a) Y X 1 X 2 X 1Y X 2Y X 1X 2 X 2

1 X 2

2

25 35 50 875 1250 175 1225 2500

30 67 42 2010 1260 2814 4489 1764

11 15 85 165 935 1275 225 7225

22 03 14 66 308 042 009 196

27 46 36 1242 972 1656 2116 1296

19 20 13 380 247 260 400 169

1 ෆ3 ෆ4 ෆ 1 ෆ8 ෆ ෆ6 ෆ 2 ෆ4 ෆ ෆ0 ෆ 4 ෆ7 ෆ3 ෆ ෆ8 ෆ 4 ෆ9 ෆ7 ෆ ෆ2 ෆ 7 ෆ7 ෆ ෆ9 ෆ7 ෆ 8 ෆ4 ෆ ෆ6 ෆ4 ෆ 1 ෆ3 ෆ1 ෆ ෆ5 ෆ0 ෆ

Las ecuaciones 13-2 13-3 y 13-4 se convierten en

Y ϭ na ϩ b1 X 1 ϩ b2 X 2 134 ϭ 6 a ϩ 186b1 ϩ 240 b2

X 1Y ϭ a X 1 ϩ b1 X 21 ϩb2 X 1 X 2 4738 ϭ 186a ϩ 8464b1 ϩ 7797b2

X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22 4972 ϭ 240a ϩ 7797b1 ϩ 13150b2

Al resolver estas ecuaciones de manera simultaacutenea se obtiene

a ϭ 203916 b1 ϭ 23403 b2 ϭ Ϫ13283

De modo que la ecuacioacuten de regresioacuten es Y ˆ ϭ 203916 ϩ 23403 X 1 Ϫ 13283 X 2b) Con X 1 ϭ 30 y X 2 ϭ 27

Y ˆ = 203916 ϩ 23403(30) Ϫ 13283(27) ϭ 2883

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1056

EA 13-2 a) En este problema Y ϭ renta X 1 ϭ nuacutemero de habitaciones X 2 ϭ distancia al centro

Y X 1 X 2 X 1Y X 2Y X 1X 2 X 2

1 X 2

2 Y 2

360 2 1 720 360 2 4 1 129600

1000 6 1 600 1000 6 36 1 1000000

450 3 2 1350 900 6 9 4 202500

525 4 3 2100 1575 12 16 9 272625

350 2 10 700 3500 20 4 100 122500

300 1 4 300 1200 4 1 16 90000

2985 18 21 11170 8535 50 70 131 1820225

Las ecuaciones 13-2 13-3 y 13-4 se convierten en

Y ϭ na ϩ b1 X 1 ϩb2 X 2 2985 ϭ 6a ϩ 18b1 ϩ 21b2

X 1Y ϭ a X 1 ϩ b1 X 21 ϩb2 X 1 X 2 11170 ϭ 18a ϩ 70b1 ϩ 50b2

X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22 8535 ϭ 21a ϩ 50b1 ϩ 131b2

Al resolver estas ecuaciones simultaacuteneas se obtiene

a ϭ 964581 b1 ϭ 1364847 b2 ϭ Ϫ24035

De manera que la ecuacioacuten de regresioacuten es

Y ˆ ϭ 964581 ϩ 1364847 X 1 Ϫ 24035 X 2

b) Cuando el nuacutemero de habitaciones ϭ 2 y la distancia al centro ϭ 2

Y ˆ ϭ 964581 ϩ 1364847(2) Ϫ 24035(2) ϭ $365

133 La computadora y la regresioacutenmuacuteltiple

En el capiacutetulo 12 y hasta donde vamos de eacuteste hemos presentado problemas simplificados y muestrasde tamantildeo pequentildeo Despueacutes del ejemplo de la seccioacuten anterior probablemente usted haya llegadoa la conclusioacuten de que no estaacute interesado en la regresioacuten si tiene que hacer los caacutelculos a mano Dehecho conforme aumenta el tamantildeo de las muestras y crece el nuacutemero de variables independientespara la regresioacuten hacer los caacutelculos incluso con la ayuda de una calculadora de bolsillo se convier-te en algo muy inconveniente

Sin embargo como administradores debemos manejar problemas complejos que requieren mues-tras maacutes grandes y variables independientes adicionales Como ayuda para resolver estos problemasmaacutes detallados utilizaremos una computadora que nos permitiraacute realizar un gran nuacutemero de caacutelcu-los en poco tiempo

Suponga que tenemos no una ni dos variables independientes sino un nuacutemero k de ellas X 1

X 2 X k Como antes sea n el nuacutemero de datos que se tienen La ecuacioacuten de regresioacuten que inten-tamos estimar es

Inconvenienciadel caacutelculo deregresiones a mano

Ecuacioacuten de estimacioacuten de regresioacuten muacuteltiple

Y ˆ ϭ

b1 X 1ϩ

b2 X 2ϩ ϩ

bk X k [13-5]

Ahora veremos coacutemo podemos utilizar una computadora para estimar los coeficientes de regresioacutenPara demostrar coacutemo una computadora maneja el anaacutelisis de regresioacuten muacuteltiple tomemos el pro-

blema del Servicio Interno de Contribuciones (IRS) de la seccioacuten anterior Suponga que el departa-mento de auditoriacuteas agrega a su modelo la informacioacuten correspondiente a las recompensas para losinformantes La dependencia desea incluir esta tercera variable independiente X 3 debido a que sien-

Demostracioacuten de laregresioacuten muacuteltipleen la computadora

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1156

te que existe cierta relacioacuten entre estas recompensas y el descubrimiento de impuestos no pEn la tabla 13-3 se registroacute la informacioacuten de los uacuteltimos 10 meses

Para resolver este problema la divisioacuten de auditoriacutea usoacute el procedimiento de regresioacutende Minitab Por supuesto todaviacutea no sabemos coacutemo interpretar la solucioacuten que proporciocomo veremos la mayor parte de los nuacutemeros dados en la solucioacuten corresponden muy de c

los estudiados en el contexto de regresioacuten simple

Salida de Minitab

Una vez que se introducen los datos y se eligen las variables dependiente e independientescalcula los coeficientes de regresioacuten y varios estadiacutesticos asociados con la ecuacioacuten de regrveraacute la salida del programa para el problema del IRS La figura 13-2 da la primera parte de la

1 La ecuacioacuten de regresioacuten De los nuacutemeros dados en la columna Coef se puede leercioacuten de estimacioacuten

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ b3 X 3

ϭ Ϫ45796 ϩ 0597 X 1 ϩ 1177 X 2 ϩ 0405 X 3

Podemos interpretar esta ecuacioacuten en una forma similar a la de la ecuacioacuten de regresioacutevariables en la paacutegina 558 Si se mantienen constantes el nuacutemero de horas de audicampo X 1 y el nuacutemero de horas de computadora X 2 y se cambian las recompeninformantes X 3 entonces el valor de Y ˆ aumentaraacute $405000 por cada $1000 pagadosformantes De igual manera al mantener X 1 y X 3 constantes se ve que por cada 1adicionales de tiempo de computadora Y ˆ aumentaraacute $1177000 Por uacuteltimo si se dej

Buacutesqueda e interpre-tacioacuten de la ecuacioacutende regresioacuten

Salida del programaMinitab

Uso de Minitab pararesolver problemasde regresioacuten muacuteltiple

Factores relacionadoscon el descubrimientode impuestos nopagados

Tabla 13-3 Horas en Impueauditoriacuteas Horas Recompensa pagde campo en computadora a informantes descub(cientos) (cientos) (miles) (mill

Mes X 1 X 2 X 3

Enero 45 16 71 2

Febrero 42 14 70 2

Marzo 44 15 72 2

Abril 45 13 71 2

Mayo 43 13 75 2

Junio 46 14 74 2

Julio 44 16 76 3

Agosto 45 16 69 2

Septiembre 44 15 74 2

Octubre 43 15 73 2

FIGURA 13-2

Salida de Minitabpara la regresioacuten

del ServicioInterno deContribuciones

Anaacutel i s i s de r e gr e s i oacuten

La ec ua ci oacuten de r egr es i oacuten es

DESCUBRE ϭ mdash45 0 ϩ 0 597 AUDI T ϩ 1 18 COMPUTADORA ϩ 0 405 RECOMPENS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e Ϫ45 796 4 878 Ϫ9 39 0 000AUDI T 0 50697 0 08112 7 36 0 000COMPUTADORA 1 17684 0 08407 14 00 0 000RECOMPENSA 0 40511 0 04223 9 59 0 000

s ϭ 0 2861 R- s q ϭ 98 3

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1256

tantes X 2 y X 3 se estima que 100 horas adicionales dedicadas a auditoriacuteas de campo descubri-raacuten $597000 adicionales de impuestos no pagados Observe que se redondearon los valoresproporcionados por la regresioacuten dada por Minitab (figura 13-2)

Suponga que en noviembre el IRS intenta dejar las horas de trabajo en auditoriacuteas de cam-po y las horas en computadora en sus niveles de octubre (4300 y 1500) pero decide aumen-tar las recompensas pagadas a los informantes a $75000 iquestCuaacutento de impuestos no pagadosesperan descubrir en noviembre Sustituyendo estos valores en la ecuacioacuten de regresioacuten esti-mada obtenemos

Y ˆ ϭ Ϫ45796 ϩ 0597 X 1 ϩ 1177 X 2 ϩ 0405 X 3

Y ˆ ϭ Ϫ45796 ϩ 0597(43) ϩ 1177(15) ϩ 0405(75)

Y ˆ ϭ Ϫ45796 ϩ 25671 ϩ 17655 ϩ 30375

Y ˆ ϭ 27905 larr Descubrimientos estimados $27905000

De modo que el departamento de auditoriacuteas espera descubrir aproximadamente $28 millonesde evasioacuten de impuestos en noviembre

2 Una medida de dispersioacuten el error estaacutendar de la estimacioacuten de la regresioacuten muacuteltiple Ya quehemos determinado la ecuacioacuten que relaciona a nuestras tres variables necesitamos una me-dida de la dispersioacuten alrededor de este plano de regresioacuten muacuteltiple En la regresioacuten simple laestimacioacuten es maacutes precisa conforme el grado de dispersioacuten alrededor de la regresioacuten es menorLo mismo es cierto para los puntos de la muestra que se encuentran alrededor del plano de re-gresioacuten muacuteltiple Para medir esta variacioacuten debemos utilizar de nuevo la medida conocida co-

mo error estaacutendar de la estimacioacuten

Medicioacuten de ladispersioacuten alrededordel plano de regre-sioacuten muacuteltiple usodel error estaacutendar dela estimacioacuten

Error estaacutendar de la estimacioacuten

se ϭ Ί [13-6]Y ndash Y ˆ )2ᎏᎏ

n Ϫ k Ϫ 1

donde

bull Y ϭ valores muestrales de la variable dependientebull Y ˆ ϭ valores correspondientes estimados con la ecuacioacuten de regresioacutenbull n ϭ nuacutemero de puntos de la muestrabull k ϭ nuacutemero de variables independientes (ϭ 3 en nuestro ejemplo)

El denominador de esta ecuacioacuten indica que en la regresioacuten muacuteltiple con k variables in-

dependientes el error estaacutendar tiene n Ϫ k Ϫ 1 grados de libertad Esto se debe a que los

grados de libertad se reducen de n en k ϩ 1 constantes numeacutericas a b1 b2 hellip b k que se

estimaron a partir de la misma muestra

Para calcular se observamos los errores individuales (Y Ϫ Y ˆ ) en el plano de regresioacuten ajus-tado los elevamos al cuadrado calculamos su media (dividiendo entre n Ϫ k Ϫ 1 en lugar den) y tomamos la raiacutez cuadrada del resultado Debido a la forma en que se calcula se se cono-ce a veces como raiacutez del error cuadraacutetico medio [o raiacutez de mse (mean-square error)] De lasalida de Minitab que usa s en lugar de se para denotar el error estaacutendar vemos que la raiacutez demse en el problema del Servicio Interno de Contribuciones es 0286 es decir $286000

Como en el caso de la regresioacuten simple podemos utilizar el error estaacutendar de la estimacioacuteny la distribucioacuten t para formar un intervalo de confianza alrededor de nuestro valor estimadoY ˆ En el problema de la evasioacuten de impuestospara 4300 horas de trabajo en auditoriacuteas de cam-po 1500 horas en computadora y $75000 de pago a informantes Y ˆ es $27905000 como es-timacioacuten de impuestos no pagados descubiertos y se es $286000 Si deseamos construir unintervalo de confianza del 95 alrededor de esta estimacioacuten de $27905000 miramos enla tabla 2 del apeacutendice en la columna del 5 y localizamos ahiacute el rengloacuten correspondiente a

Intervalos deconfianza para Y ˆ

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1356

n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad El valor apropiado de t para nuestracioacuten del intervalo es de 2447 En consecuencia podemos calcular los liacutemites de nutervalo de confianza como sigue

Y ˆ ϩ t (se) ϭ 27905000 ϩ (2447)(286000)

Y ˆ ϩ t(se) ϭ 27905000 ϩ 699800

Y ˆ ϩ t(se) ϭ 28604800 larr Liacutemite superior

Y ˆ Ϫ t (se) ϭ 27905000 Ϫ (2447)(286000)

Y ˆ ϩ t(se) ϭ 27905000 ndash 699800

Y ˆ ϩ t(se) ϭ 27205200 larr Liacutemite inferior

Con un nivel de confianza del 95 el departamento de auditoriacuteas puede sentirse sque los descubrimientos reales estaraacuten en este intervalo que va de $27205200 a $28Si el IRS desea usar un nivel de confianza menor como 90 puede reducir el intevalores para la estimacioacuten de descubrimientos de impuestos no pagados Igual que cgresioacuten simple podemos utilizar la distribucioacuten normal estaacutendar (tabla 1 del apeacutendaproximar la distribucioacuten t siempre que los grados de libertad (n menos el nuacutemero cientes de regresioacuten estimados) sea un nuacutemero mayor que 30

Al antildeadir la tercera variable independiente (recompensas a informantes) iquestmejoroacuteregresioacuten Como se mide la dispersioacuten de los datos alrededor del plano de regresioacutenmenores de se deberiacutean indicar mejores regresiones Para la regresioacuten de dos variablecimos con anterioridad en este mismo capiacutetulo se resultoacute ser 1076 Como al agregarra variable se se redujo a 0286 vemos que siacute mejoroacute el ajuste de la regresioacuten en este Sin embargo en general no es cierto que al agregar variables siempre se reduzc

3 El coeficiente de determinacioacuten muacuteltiple Al estudiar el anaacutelisis de correlacioacuten simpmos la fuerza de la relacioacuten entre dos variables utilizando el coeficiente de determinla muestra r 2 Este coeficiente de determinacioacuten es la fraccioacuten de la variacioacuten total riable dependiente Y que se explica con la ecuacioacuten de estimacioacuten

Similarmente en la correlacioacuten muacuteltiple mediremos la fuerza de la relacioacuten entre trbles utilizando el coeficiente de determinacioacuten muacuteltiple R

2 o su raiacutez cuadrada R (el cte de correlacioacuten muacuteltiple) Este coeficiente de determinacioacuten muacuteltiple es tambieacuten la

que representa la porcioacuten de la variacioacuten total de Y que ldquoexplicardquo el plano de regr

Note que la salida del programa da el valor 983 para R2 Esto nos dice que las tr

bles independientes explican el 983 de la variacioacuten total de impuestos no pagadobiertos Para la regresioacuten de dos variables hecha antes R2 es soacutelo 0729 asiacute que las trabajo en auditoriacutea de campo y las horas en computadora explican el 729 de la vaagregar las recompensas a los informantes explica el 254 restante de la variacioacuten

Todaviacutea no hemos explicado los nuacutemeros en las columnas etiquetadas con Desvciente t y p de la figura 13-2 Estos nuacutemeros se utilizaraacuten para hacer inferencias acercano de regresioacuten de la poblacioacuten tema que se trataraacute en la seccioacuten 13-4

Uso del coeficientede determinacioacutenmuacuteltiple

Valor de variablesadicionales

Interpretacioacuten delintervalo deconfianza

Ya nadie calcula regresiones a mano hayotras cosas maacutes interesantes en queacute ocu-par nuestro tiempo Se explicoacute la teacutecnicacalculando las soluciones a mano para

que no tenga que pensar en su computadora como en unaldquocaja negrardquo que hace muchas cosas uacutetiles que no puedeexplicar Sugerencia el valor real de usar la computadorapara calcular regresiones muacuteltiples es que puede manejarmuchas variables independientes y obtener una mejor ecua-

cioacuten de estimacioacuten que puede medir si agregar otrble independiente realmente mejora los resultados yposible observar con rapidez el comportamiento de

indica la proporcioacuten de la variacioacuten total de la variapendiente que se explica con las variables indepenLa computadora hace todo el trabajo tedioso mdashsin semdash y le deja tiempo para el trabajo maacutes importcomprender los resultados y usarlos para tomar mdecisiones

SUGERENCIASY

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1456

La ec uac i oacuten de r egr es i oacuten esY = - 12 75 + 17 1 X1 + 0 54 1 X2 - 0 17 4 X3

Pr onos t i c ador Coe f De s vEs t Coc i e nt e - t pCons t a n t e - 1275 2699 - 0 47 0 719X1 17 059 6 908 2 47 0 245X2 0 5406 0 3144 1 72 0 335X3 - 0 1743 0 1005 - 1 73 0 333

s = 396 1 R- s q = 87 2

b) iquestQueacute porcentaje de la variacioacuten total del nuacutemero de solicitudes urgentes de devolucioacuten de impuestosexplica esta ecuacioacuten

c) Para este antildeo el iacutendice econoacutemico es 169 la poblacioacuten residente en un radio de una milla desde la

oficina es 10212 habitantes y el ingreso promedio en Ithaca es $26925 iquestCuaacutentas solicitudes urgen-tes de devolucioacuten de impuestos debe Pam esperar procesar entre el 1 de marzo y el 15 de abril

Conceptos baacutesicos 13-14 Dado el siguiente conjunto de datos utilice el paquete de software que tenga disponible para encontrar la

ecuacioacuten de regresioacuten de mejor ajuste y responda a lo siguientea) iquestCuaacutel es la ecuacioacuten de regresioacutenb) iquestCuaacutel es el error estaacutendar de la estimacioacutenc) iquestCuaacutel es el valor de R

2 para esta regresioacutend) iquestCuaacutel es el valor pronosticado para Y cuando X 1 ϭ 58 X 2 ϭ 42 y X 3 ϭ 51

Y X 1 X 2 X 3

647 35 53 85809 74 16 26246 25 63 45439 37 94 88777 55 14 36206 83 92 25669 67 25 27343 12 22 13

Ejercicios 133

Ejercicios de autoevaluacioacuten

EA 13-3 Pam Schneider posee y opera un despacho de contadores en Ithaca Nueva York Ella piensa que seriacutea uacutetilpredecir el nuacutemero de solicitudes urgentes de devolucioacuten de impuestos que le pediraacuten durante el ajetrea-do periodo del 1 de marzo al 15 de abril para poder planear mejor sus necesidades de personal duranteesta eacutepoca Tiene la hipoacutetesis de que varios factores pueden ser uacutetiles para su pronoacutestico Los datos de es-tos factores y el nuacutemero de solicitudes urgentes de devolucioacuten de impuestos de antildeos pasados son

Y X 2 Nuacutemero de

Poblacioacuten solicitudesresidente X 3 de devolucioacuten

X 1 en un radio Ingreso urgentesIacutendice de una milla promedio (1 de marzo

econoacutemico desde la oficina en Ithaca a 15 de abril)

99 10188 21465 2306106 8566 22228 1266100 10557 27665 1422129 10219 25200 1721179 9662 26300 2544

a) Use el siguiente resultado de Minitab para determinar la ecuacioacuten de regresioacuten maacutes adecuada para es-

tos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1556

13-15 Dado el siguiente conjunto de datos utilice el paquete de software que tenga a su disposicioacuten patrar la ecuacioacuten de regresioacuten de mejor ajuste y responda a lo siguientea) iquestCuaacutel es la ecuacioacuten de regresioacutenb) iquestCuaacutel es el error estaacutendar de la estimacioacutenc) iquestCuaacutel es el valor de R2 para esta regresioacutend) Deacute un intervalo de confianza para la estimacioacuten del 95 para el valor Y cuando los valores X

y X 4 son 524 416 358 y 3 respectivamente

X 1 X 2 X 3 X 4 Y

214 629 219 Ϫ2 228

517 407 429 5 937418 818 698 2 649

118 410 909 Ϫ4 192

716 226 129 8 558

919 615 309 1 231

Aplicaciones

1316 Las estaciones de policiacutea en Estados Unidos estaacuten interesadas en predecir el nuacutemero de arrestodos que deberaacuten procesar cada mes para programar mejor a los empleados de oficina En los daricos el nuacutemero promedio de arrestos (Y ) cada mes tiene influencia del nuacutemero de oficiales en

policiaca ( X 1) la poblacioacuten de la ciudad en miles ( X 2) y el porcentaje de personas desempleadasdad en miles ( X 3) Los datos de estos factores en 15 ciudades se presentan en la tablaa) Utilice el paquete de software que tenga disponible para determinar la ecuacioacuten de regresioacuten

jor se ajuste a estos datosb) iquestQueacute porcentaje de la variacioacuten total en el nuacutemero de arrestos (Y ) explica esta ecuacioacutenc) El departamento de policiacutea de ChapelBoro desea pronosticar el nuacutemero de arrestos mensua

pelBoro tiene una poblacioacuten de 75000 habitantes 82 elementos en su fuerza policiaca y utaje de desempleo del 105 iquestCuaacutentos arrestos pronostica para cada mes

Nuacutemero promedio Nuacutemero de oficiales Tamantildeo de la ciudad (X 2) Porcende arrestos mensuales (Y ) en la fuerza (X 1) en miles de habitantes desemp

3906 68 816 4

5043 94 751 3

6284 125 973 5

7456 175 1235 8

5852 113 1184 11

4503 82 654 9

3278 46 616 12

2605 32 543 18

4775 89 974 4

3898 67 824 6

3124 47 564 8

3675 59 713 7

3744 61 674 9

4946 87 963 11

4875 92 864 4

13-17 Estamos intentando predecir la demanda anual (DEMAND) de cierto producto utilizando las svariables independientes

PRECIO ϭ precio del producto (en doacutelares)

INGRESO ϭ ingreso del consumidor (en doacutelares)

SUB ϭ precio de un bien sustituto (en doacutelares)

( Nota Un bien sustituto es aquel que puede suplir a otro bien Por ejemplo la margarina es untituto de la mantequilla)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1656

Se recolectaron datos correspondientes al periodo 1982-1996

Antildeo Demanda Precio ($) Ingreso ($) Sub ($)

1982 40 9 400 101983 45 8 500 141984 50 9 600 121985 55 8 700 131986 60 7 800 111987 70 6 900 151988 65 6 1000 161989 65 8 1100 17

1990 75 5 1200 221991 75 5 1300 191992 80 5 1400 201993 100 3 1500 231994 90 4 1600 181995 95 3 1700 241996 85 4 1800 21

a) Utilice el paquete de software que tenga disponible para encontrar la ecuacioacuten de regresioacuten ajuste para estos datos

b) iquestSon los signos (ϩ o Ϫ) de los coeficientes de regresioacuten de las variables independientes los qperan Deacute una explicacioacuten breve ( Nota Eacutesta no es una pregunta estadiacutestica soacutelo necesita pesignifican los coeficientes de regresioacuten)

c) Establezca e interprete el coeficiente de determinacioacuten muacuteltiple del problemad) Establezca e interprete el error estaacutendar de la estimacioacuten para el problemae) Seguacuten la ecuacioacuten de regresioacuten obtenida iquestqueacute valor de DEMAND predeciriacutea si el precio de

ductos fue $6 el ingreso del consumidor $1200 y el precio del bien sustituto $17 13-18 Bill Buxton profesor de estadiacutestica de una prominente escuela de administracioacuten tiene un prof

tereacutes en los factores que afectan el desempentildeo de los estudiantes en los exaacutemenes El examen psemestre anterior tuvo una distribucioacuten de calificaciones amplia pero Bill tiene la certeza de qfactores explican esa distribucioacuten permite a sus estudiantes que estudien en tantos libros comoca el coeficiente de inteligencia de los estudiantes variacutea tienen distintas edades y difieren losque dedican a estudiar Con el propoacutesito de desarrollar una foacutermula de prediccioacuten para las califde los exaacutemenes Bill pidioacute a cada estudiante que respondiera al final del examen preguntas refe

tiempo de estudio y nuacutemero de libros utilizados Los registros que teniacutea Bill ya incluiacutean el coefiinteligencia y la edad de modo que reunioacute los datos del grupo y corrioacute la regresioacuten muacuteltiple deLa salida de la corrida de Bill fue la siguiente

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t Con s t a nt e minus49 948 41 55 minus1 20 0HORAS 1 06931 0 98163 1 09 0CI 1 36460 0 37627 3 63 0LI BROS 2 03982 1 50799 1 35 0EDAD minus1 79890 0 67332 minus2 67 0

s = 11 657 R- s q = 76 7

a) iquestCuaacutel es la ecuacioacuten de regresioacuten de mejor ajuste para estos datos

b) iquestQueacute porcentaje de la variacioacuten en las calificaciones se explica con esta ecuacioacutenc) iquestQueacute calificacioacuten esperariacutea usted para un estudiante de 21 antildeos de edad con un coeficiente gencia (CI) de 113 que estudioacute durante cinco horas y utilizoacute tres libros diferentes

13-19 La compantildeiacutea de tiendas de abarrotes Twenty-Two estaacute planeando expandir su cadena Como ayudleccionar los lugares donde abriraacute las nuevas tiendas recolectoacute datos de las ventas semanales de casus 23 tiendas Para explicar la variabilidad de las ventas semanales tambieacuten reunioacute informacioacutencribe cuatro variables que se cree estaacuten relacionadas con las ventas Las variables se definen como

VENTAS ϭ ventas semanales promedio en cada tienda en miles de doacutelares

AUTOS ϭ volumen promedio de traacutensito de automoacuteviles por semana en miles de autos

ENTRADA ϭ facilidad de entradasalida medida en una escala de 1 a 100

INGANUAL ϭ ingreso anual promedio por familia en el aacuterea en miles de doacutelares

DISTANCIA ϭ distancia en millas desde la tienda al supermercado maacutes cercano

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1756

Los datos se analizaron con Minitab y la salida es la siguiente

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t Cons t a nt e 175 37 92 62 1 89 0 0AUTOS - 0 028 0 315 minus0 09 0 9ENTRADA 3 775 1 272 2 97 0 0I NGANUAL 1 990 4 510 0 44 0 6DI STANCI A 212 41 28 090 7 56 0 0

s = 85 587 R- s q = 95 8

a) iquestCuaacutel es la ecuacioacuten de regresioacuten de mejor ajuste dada por Minitab

b) iquestCuaacutel es el error estaacutendar de la estimacioacuten para esta ecuacioacutenc) iquestQueacute fraccioacuten de la variacioacuten en las ventas se explica con esta regresioacutend) iquestQueacute ventas predeciriacutea para una tienda localizada en un vecindario que tuvo un ingreso anu

milia de $20000 estaba a 2 millas del supermercado maacutes cercano se encontraba en una calvolumen promedio semanal de traacutensito de 100000 autos y con una facilidad de entrada de

13-20 Rick Blackburn estaacute pensando en vender su casa Con el fin de decidir el precio que pediraacute poreunido datos de 12 ventas recientes Registroacute el precio de venta (en miles de doacutelares) el nuacutemercuadrados de construccioacuten (en cientos de pies cuadrados) el nuacutemero de pisos el nuacutemero de bantiguumledad de la casa (en antildeos)

Precio de venta Pies cuad Pisos Bantildeos Antiguumledad

4965 89 1 10 2

6795 95 1 10 68115 126 2 15 11

8160 129 2 15 8

9150 190 2 10 22

9525 176 1 10 17

10035 200 2 15 12

10425 206 2 15 11

11265 205 1 20 9

14970 251 2 20 8

16065 227 2 20 18

23250 408 3 40 12

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de

de mejor ajuste para los datosb) iquestCuaacutel es el valor de R2 para esta ecuacioacutenc) Si la casa de Rick tiene 1800 pies cuadrados (ϭ 180 cientos de pies cuadrados) un piso

y seis antildeos de antiguumledad iquestqueacute precio de venta puede esperar Rick 13-21 La Allegheny Steel Corporation ha estado buscando los factores que influyen en la cantidad de

millones de toneladas) que puede vender cada antildeo La administracioacuten sospecha que los siguientfactores principales la tasa anual de inflacioacuten del paiacutes el precio promedio por tonelada del acetado que acota los precios (en doacutelares) de Allegheny y el nuacutemero de automoacuteviles (en millonesfabricantes de autos de Estados Unidos planean producir ese antildeo Se recolectaron los datos de losiete antildeos

Y X 2 X 3

Millones X 1 Cota de Nuacutemero

de tons Tasa de importa- deAntildeo vendidas inflacioacuten ciones automoacuteviles

1993 42 31 310 62

1992 31 39 500 51

1991 40 75 220 57

1990 47 107 450 71

1989 43 155 435 65

1988 37 130 260 61

1987 35 110 305 59

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1856

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de regresioacutende mejor ajuste para los datos

b) iquestQueacute porcentaje de la variacioacuten total de la cantidad de acero vendido (en millones de toneladas) porAllegheny cada antildeo explica esta ecuacioacuten

c) iquestCuaacutentas toneladas de acero deberaacute esperar Allegheny vender en un antildeo en el que la tasa de inflacioacutenes 71 los fabricantes de automoacuteviles norteamericanos planean producir 60 millones de autos y la co-ta promedio del acero importado por tonelada es $350

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-3 De la salida del paquete de software se obtienen los siguientes resultadosa) Y ˆ ϭ Ϫ1275 ϩ 17059 X 1 ϩ 05406 X 2 Ϫ 01743 X 3b) R

2ϭ 872 el modelo explica el 872 de la variacioacuten total en Y

c) Y ˆ ϭ Ϫ1275 ϩ 17059(169) ϩ 05406(10212) Ϫ 01743(26925) ϭ 2436 reembolsos de impuestos

134 Inferencias sobre paraacutemetrosde poblacioacuten

En el capiacutetulo 12 se vio que la recta de regresioacuten de la muestra Y ˆ ϭ a ϩ bX (ecuacioacuten 12-3) esti-maba la recta de regresioacuten de la poblacioacuten Y ϭ A ϩ BX (ecuacioacuten 12-13) La razoacuten por la cual soacute-lo podiacuteamos estimar la recta de regresioacuten de poblacioacuten y no determinarla con exactitud era que los

puntos no caen exactamente en la recta de regresioacuten de la poblacioacuten Debido a las variaciones alea-torias los puntos satisfaciacutean Y ϭ A ϩ BX ϩ e (ecuacioacuten 12-13a) maacutes que a Y ϭ A ϩ BX

En la regresioacuten muacuteltiple se tiene justo la misma situacioacuten Nuestro plano de regresioacuten estimado

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k [13-5]

es una estimacioacuten de un plano de regresioacuten de poblacioacuten verdadero pero desconocido de la forma

Plano de regresioacutende la poblacioacuten

De nuevo los puntos individuales normalmente no caen con exactitud en el plano de regresioacuten depoblacioacuten Consideremos el problema del Servicio Interno de Contribuciones para ver por queacute Notodos los pagos a informantes tendraacuten la misma efectividad Algunas horas en computadora podriacuteanutilizarse para recolectar y organizar datos otras para analizar esos datos en busca de errores y frau-des El eacutexito de la computadora en descubrir impuestos no pagados puede depender de cuaacutento tiempose dedique a cada una de estas actividades Por eacutestas y otras razones algunos de los puntos se en-contraraacuten arriba del plano de regresioacuten y algunos estaraacuten abajo de eacuteste En lugar de satisfacer laecuacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

los puntos individuales satisfaraacuten la ecuacioacuten

Las variaciones alea-torias desplazan lospuntos del plano deregresioacuten

Ecuacioacuten de regresioacuten de la poblacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

Plano de regresioacuten de la poblacioacuten maacutes la variacioacuten aleatoria

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e [13-7a]

La cantidad e que aparece en la ecuacioacuten 13-7a es una variacioacuten aleatoria que en promedio es iguala cero La desviacioacuten estaacutendar de las variaciones individuales e y el error estaacutendar de la estima-cioacuten se que estudiamos en la seccioacuten anterior es una estimacioacuten de e

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1956

Como nuestro plano de regresioacuten de la muestra Y ˆ ϭ a ϩ b1X1 ϩ b2 X 2 ϩ ϩ bk X k (ecuaci13-7) estima el plano de regresioacuten de poblacioacuten desconocido Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk

(ecuacioacuten 13-7) deberemos ser capaces de usarlo para hacer inferencias sobre el plano de regreside la poblacioacuten En esta seccioacuten haremos inferencias acerca de las pendientes ( B1 B2 Bk ) deecuacioacuten de regresioacuten ldquoverdaderardquo (la que se aplica a la poblacioacuten completa) basadas en las pendietes (b1 b2 bk ) de la ecuacioacuten de regresioacuten estimada a partir de la muestra de datos

Inferencias acerca de una pendiente individual B i El plano de regresioacuten se deriva de una muestra y no de la poblacioacuten completa Como resultado

podemos esperar que la ecuacioacuten de regresioacuten verdadera Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k que se aplica a la poblacioacuten completa) sea exactamente igual que la ecuacioacuten estimada a partir observaciones de la muestra Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k Sin embargo podemos utilizarvalor de bi una de las pendientes que calculamos a partir de la muestra para probar hipoacutetesis acca del valor de Bi una de las pendientes del plano de regresioacuten para la poblacioacuten completa

El procedimiento para probar una hipoacutetesis respecto a Bi es parecido al procedimiento analizaen los capiacutetulos 8 y 9 sobre pruebas de hipoacutetesis Para entender este proceso regresemos al probma que relaciona los impuestos no pagados descubiertos con las horas de trabajo en auditoriacuteas campo horas en computadora y recompensas a informantes En la paacutegina 729 sentildealamos que b10597 El primer paso consiste en encontrar un valor para B1 y compararlo con b1 ϭ 0597

Suponga que durante un periodo largo la pendiente de la relacioacuten entre Y y X 1 fue 0400 Paprobar si todaviacutea es vaacutelida podriacuteamos definir las hipoacutetesis como

H0 B1 ϭ 0400 larr Hipoacutetesis nula

H1 B1 0400 larr Hipoacutetesis alternativa

De hecho realizamos la prueba para saber si los datos actuales indican que B1 ha cambiado su vahistoacuterico de 0400

Para encontrar el estadiacutestico de prueba para B1 es necesario hallar primero el error estaacutendar d

coeficiente de regresioacuten El coeficiente de regresioacuten con el que estamos trabajando es b1 de moque el error estaacutendar de este coeficiente se representa con sb1

Resulta demasiado difiacutecil calcular sb1 a mano pero por fortuna Minitab calcula los errores estaacutedar de todos los coeficientes de regresioacuten Por comodidad repetimos la figura 13-2 Los errores taacutendar de los coeficientes se dan en la columna DesvEst de la salida de Minitab

En el cuadro de salida vemos que sb1

es 00811 (Similarmente si deseamos probar una hipoacutesis acerca de B2 vemos que el error estaacutendar apropiado que debemos utilizar es sb2 ϭ 00841) Uvez que encontramos sb1 en la salida de Minitab podemos usar la ecuacioacuten 13-8 para estandarizarpendiente de nuestra ecuacioacuten de regresioacuten ajustada

Estandarizacioacutendel coeficiente deregresioacuten

Error estaacutendar delcoeficientede regresioacuten

Prueba de unahipoacutetesis acerca de B i

Diferencia entre la

ecuacioacuten de regre-sioacuten verdadera y unaestimada a partir delas observacionesde la muestra

Coeficiente de regresioacuten estandarizado

t ϭ [13-8bi ndash Bi0ᎏ

sbi

donde

bull biϭ pendiente de la regresioacuten ajustada

bull Bi0 ϭ pendiente real hipoteacutetica para la poblacioacutenbull sbi ϭ error estaacutendar del coeficiente de regresioacuten

iquestPor queacute utilizamos t para denotar el estadiacutestico estandarizado Recuerde que en la regresioacuten siple utilizamos a y b en la ecuacioacuten 12-7 para calcular se y que se estimaba e la desviacioacuten estaacutedar de las variaciones de los datos (ecuacioacuten 12-13a) Entonces utilizamos se en la ecuacioacuten 12-para encontrar sb el error estaacutendar del coeficiente de regresioacuten que corresponde a la pendiente E

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2056

pezamos con n puntos y los usamos para estimar los dos coeficientes a y b Luego basamtras pruebas en la distribucioacuten t con n Ϫ 2 grados de libertad

De manera similar en la regresioacuten muacuteltiple tambieacuten empezamos con n puntos pero lospara estimar k ϩ 1 coeficientes la ordenada a y k pendientes b1 b2 bk Despueacutes estcientes se usan en la ecuacioacuten 13-6 para calcular se que de nuevo es una estimacioacuten de eviacioacuten estaacutendar de las variaciones de los datos (ecuacioacuten 13-7a) Luego se utiliza se (en ucioacuten que estaacute maacutes allaacute del alcance de este libro) para encontrar s

bi Debido a lo anterior

nuestras pruebas de hipoacutetesis en la distribucioacuten t con n Ϫ k Ϫ 1 (ϭ n Ϫ ( k ϩ l)) grados de En nuestro ejemplo el valor estandarizado del coeficiente de regresioacuten es

t ϭ

ϭ

ϭ 2432 larr Coeficiente de regresioacuten estandarizado

Suponga que estamos interesados en probar nuestras hipoacutetesis al nivel de significancia

Como tenemos 10 observaciones en la muestra y tres variables independientes sabemos n Ϫ k Ϫ 1 o 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad Buscamos en la tabla 2 del apeacutendice en lana de 10 y el rengloacuten de 6 grados de libertad Ahiacute vemos que el valor apropiado de t es 19mo nos preocupa si b1 (la pendiente del plano de regresioacuten de la muestra) es significativamferente de B1 (la pendiente hipoteacutetica del plano de regresioacuten de la poblacioacuten) eacutesta es una pdos colas y los valores criacuteticos son Ϯ1943 El coeficiente de regresioacuten estandarizado es 2se encuentra fuera de la regioacuten de aceptacioacuten de nuestra prueba de hipoacutetesis Por consiguichazamos la hipoacutetesis nula de que B1 todaviacutea es igual a 0400 En otras palabras existe unacia suficientemente grande entre b1 y 0400 para concluir que B1 ha cambiado respecto a histoacuterico Por esto sentimos que cada 100 horas adicionales de trabajo en auditoriacuteas de camaumentan la cantidad de descubrimientos de impuestos no pagados en $400000 como lo hel pasado

Ademaacutes de la prueba de hipoacutetesis podemos construir un intervalo de confianza para cude los valores de Bi Del mismo modo que bi es una estimacioacuten puntual de Bi estos intervalofianza son estimaciones de intervalo de Bi Para ilustrar el proceso de construccioacuten de interconfianza encontremos un intervalo de confianza del 95 para B3 en el ejemplo del IRS Lrelevantes son

b3 ϭ 0405 de la figura 13-2sb3 ϭ 00422

t ϭ 2447 larr Nivel de significancia del 5 y 6 grados de libertad

Intervalo deconfianza para B i

Realizacioacuten de la

prueba de hipoacutetesis

0597 ndash 0400ᎏᎏ

0081

b1 ndash B10ᎏ

sb1

Anaacute l i s i s de r e gr e s i oacutenLa ec uaci oacuten de r egr es i oacuten esDESCUBRE = - 45 0 + 0 597 AUDI TORIacute A + 1 18 COMPUTADORA + 0 405 RECOMPENSA

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 45 796 4 878 - 9 39 0 000AUDI TORIacute A 0 50697 0 08112 7 36 0 000COMPUTADORA 1 17684 0 08407 14 00 0 000RECOMPENSAS 0 40511 0 04223 9 59 0 000

s = 0 2861 R- s q = 98 3

FIGURA 13-2

Salida de Minitab(figura repetida)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2156

Con esta informacioacuten podemos calcular el intervalo de confianza de la siguiente manera

b3 ϩ t (sb3) ϭ 0405 ϩ 2447(00422)

ϭ 0508 larr Liacutemite superior

b3 Ϫ t (sb3) ϭ 0405 Ϫ 2447(00422)

ϭ 0302 larr Liacutemite inferior

Vemos que podemos tener una seguridad del 95 de que cada $1000 adicionales pagados a los formantes aumenta el descubrimiento de impuestos no pagados en una cantidad entre $302000$508000

A menudo estaremos interesados en preguntas del tipo iquesten realidad Y depende de X i Por ejeplo podriacuteamos preguntar si descubrir impuestos no pagados en realidad depende de las horas encomputadora Con frecuencia esta pregunta se plantea como iquestes X i una variable explicativa sigficativa de Y Si piensa un poco maacutes se convenceraacute de que si Bi 0 Y depende de las X i (esto esvariacutea cuando X i variacutea) y no depende de X i si Bi ϭ 0

Vemos que nuestra pregunta conduce a establecer hipoacutetesis de la forma

H0 Bi ϭ 0 larr Hipoacutetesis nula X i no es una variable explicativa significativa

H1 Bi 0 larr Hipoacutetesis alternativa X i es una variable explicativa significativa

Podemos probar estas hipoacutetesis utilizando la ecuacioacuten 13-8 del mismo modo que cuando probamnuestras hipoacutetesis acerca de si B1 todaviacutea era igual a 0400 Sin embargo existe una forma maacutes faacutede hacerlo usando la columna de la figura 13-2 de ldquocociente- t rdquo Observemos de nuevo la ecuaci13-8

t ϭ [13-

Como nuestro valor hipoteacutetico de Bi es cero el valor estandarizado del coeficiente de regresioacutedenotado por t o se convierte en

t o ϭ

El valor de t o se conoce como valor t ldquocalculadordquo Eacuteste es el nuacutemero que aparece en la columna equetada como ldquocociente-t rdquo en la figura 13-2 Denotemos por t c el valor t ldquocriacuteticordquo que buscamos

la tabla 2 del apeacutendice Entonces como la prueba para determinar si X i es una variable explicatisignificativa es una prueba de dos colas soacutelo necesitamos verificar si Ϫt c Յ t o Յ t c

Uso de valores t

calculados en lasalida de Minitab

biᎏ

sbi

bi ndash Bi0ᎏ

sbi

iquestEs significativa unavariable explicativa

Prueba para determinar si una variable es o no significativa

Ϫt c Յ t o Յ t c [13-9

donde

bull t c ϭ valor t adecuado (con n Ϫ k Ϫ 1 grados de libertad) para el nivel de significancia deprueba

bull t o ϭ bi sbi ϭ valor t observado (o calculado) obtenido con el paquete de software

Si t o

cae entre Ϫt c

y t c aceptamos H0 y llegamos a la conclusioacuten de que X

ino es una variable exp

cativa significativa En cualquier otro caso rechazamos H0 y concluimos que X i es una variable eplicativa significativa

Probemos al nivel de significancia de 001 si las horas en computadora constituyen una variabexplicativa significativa para los impuestos no pagados descubiertos De la tabla 2 del apeacutendice cn Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad y ϭ 001 vemos que t c ϭ 3707 De la figura 13tenemos que t o = 1400 Como t o Ͼ t c concluimos que el tiempo en computadora es una variab

Prueba de lasignificancia de lavariable horas decomputadora en elproblema del IRS

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2256

explicativa significativa De hecho al observar los valores t calculados para las otras dos vindependientes (tiempo de auditoriacuteas de campo t o ϭ 736 y recompensa a informantes t ovemos que tambieacuten son variables explicativas significativas

Podemos tambieacuten utilizar la columna de ldquoprdquo para probar si X i es una variable explicativacativa De hecho utilizando esa informacioacuten ni siquiera necesitamos usar la tabla 2 del aLos elementos de esta columna son los valores prob para las hipoacutetesis

H0 Biϭ 0

H1 Bi 0

Recuerde del anaacutelisis hecho en el capiacutetulo 9 que estos valores prob constituyen la probabque cada bi esteacute tan lejos de cero como (o maacutes) el valor observado obtenido de la regresioacutenverdadera Como se ilustra en la figura 13-3 solamente necesitamos comparar estos valocon el nivel de significancia de la prueba para determinar si X i es o no una variable expsignificativa para Y

Probar la significancia de una variable explicativa es siempre una prueba de dos colas Lble independiente X i es una variable explicativa significativa si bi es significativamente dife

cero es decir si t o es un nuacutemero grande positivo o negativoPara el ejemplo del IRS repetimos las pruebas con ϭ 001 Para cada una de las tres v

independientes p es menor que 001 de forma que podemos concluir que cada una de ellanificativa

Inferencias acerca de la regresioacuten como un todo

(usando una prueba F )

Suponga que cubre con papel un tablero para dardos y lanza varios dardos sobre eacutel Despueacuteberlo hecho tendraacute algo muy parecido a un diagrama de dispersioacuten Suponga entonces quuna recta de regresioacuten a este conjunto de ldquopuntos observadosrdquo y calcula r

2 Debido a que lofueron lanzados aleatoriamente usted espera obtener un valor bajo de r

2 puesto que en esten realidad no explica a Y Sin embargo si hace esto muchas veces ocasionalmente observalor alto de r

2 por pura casualidadDada cualquier regresioacuten simple (o muacuteltiple) es natural preguntarse si el valor de r2 (

realmente indica que las variables independientes explican a Y o si esto sucede por cas

A menudo esta interrogante se plantea de la siguiente manera iquestla regresioacuten como un todo ficativa En la uacuteltima seccioacuten vimos coacutemo decidir si una X i individual es una variable exp

Significancia de laregresioacuten comoun todo

FIGURA 13-3

Uso de ldquoprdquo paradeterminar si X i esuna variable expli-cativa significativa

Regioacuten de aceptacioacuten Regioacuten de aceptacioacuten

2 del aacuterea

2 del aacuterea

2 del aacuterea

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

ndasht c

ndasht o

t o

t c

0

(a) p es mayor que X

i no es una variable

explicativa significativa

(b) p es menor que X

i es una variable

explicativa significativa

ndasht o

ndasht c

t c

0

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2356

significativa ahora veremos coacutemo decidir si todas las X i tomadas en conjunto explican significavamente la variabilidad observada de Y Nuestras hipoacutetesis son

H0 B1 ϭ B2 ϭ ϭ Bk ϭ 0 larr Hipoacutetesis nula Y no depende de las X i

H1 por lo menos una Bi 0 larr Hipoacutetesis alternativa Y depende de al menos una de las X i

Cuando analizamos r 2 en el capiacutetulo 12 consideramos la variacioacuten total en Y sum(Y Ϫ Y ෆ )2 la p

te de dicha variacioacuten que explica la regresioacuten sum(Y ˆ Ϫ Y ෆ )2 y la parte no explicada de la variacioacutensum(Y Ϫ Y ˆ )2 La figura 13-4 es un duplicado de la figura 12-15 Sirve como repaso de la relacioacuten etre la desviacioacuten total la desviacioacuten explicada y la desviacioacuten no explicada para un solo dato en uregresioacuten simple Aunque no podamos dibujar una figura similar para una regresioacuten muacuteltiple coceptualmente estamos haciendo lo mismo

Al analizar la variacioacuten en Y fijamos nuestra atencioacuten en tres teacuterminos diferentes cada uno de cuales es una suma de cuadrados Los denotamos con

Suma de cuadradosy sus grados delibertad

Anaacutelisis de lavariacioacuten de losvalores Y

FIGURA 13-4

Desviacioacuten totaldesviacioacutenexplicada ydesviacioacuten noexplicada paraun valor observadode Y

Y

X

Un valor observado de lavariable dependiente (Y )

R e c t a d

e r e g r e s

i oacute n

Desviacioacuten no explicada de esta Y respectoa su media Y

(Y ndash Y )^

Desviacioacuten explicada deesta Y respecto a su media Y

(Y ndash Y )^Y

Valor estimado de esta Y

a partir de la recta de regresioacuten (Y )^

Desviacioacuten total de esta Y

respecto a su media Y

(Y ndash Y )

Tres sumas de cuadrados

SCT ϭ suma de cuadrados total (es decir la parte explicada) ϭ sum(Y Ϫ Y ෆ )2

SCR ϭ suma de cuadrados de la regresioacuten (es decir la parte explicada) ϭ sum(Y ˆ Ϫ Y ෆ )2 [13-10

SCE ϭ suma de cuadrados del error (es decir la parte no explicada) ϭ sum(Y Ϫ Y ˆ )2

Estaacuten relacionadas por la ecuacioacuten

que dice que la variacioacuten total en Y puede dividirse en dos partes la parte explicada y la no explicaCada una de estas sumas de cuadrados tiene un nuacutemero asociado de grados de libertad SCT t

ne n Ϫ 1 grados de libertad (n observaciones menos un grado de libertad debido a que la media la muestra estaacute fija) SCR tiene k grados de libertad porque existen k variables independientes qse utilizaron para explicar Y Finalmente SCE tiene n Ϫ k Ϫ 1 grados de libertad porque utilizamnuestras n observaciones para estimar k ϩ 1 constantes a b1 b2 bk Si la hipoacutetesis nula es ci

ta el cociente

Descomposicioacuten de la variacioacuten total de Y

SCT ϭ SCR ϩ SCE [13-1

Cociente F

F ϭ [13-12SCR k ᎏᎏ

SCE(n ndash k ndash 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2456

tiene una distribucioacuten F con k grados de libertad en el numerador y n Ϫ k Ϫ 1 grados de libel denominador Si la hipoacutetesis nula es falsa entonces el cociente tiende a ser maacutes grande qula hipoacutetesis nula es verdadera De modo que si el cociente F es demasiado grande (seguacuten lo na el nivel de significancia de la prueba y el valor apropiado de la tabla 6 del apeacutendice) rechH0 y concluimos que la regresioacuten como un todo es significativa

La figura 13-5 presenta la salida de Minitab para el problema del IRS Esta parte del rincluye los cocientes F calculados para la regresioacuten en ocasiones llamado anaacutelisis de v

(ANOVA) para la regresioacuten Probablemente se pregunte si esto tiene algo que ver con el anaacutelisrianza que estudiamos en el capiacutetulo 11 La respuesta es siacute Aunque no lo hicimos es posibletrar que el anaacutelisis de varianza visto en el capiacutetulo 11 tambieacuten contempla la variacioacuten total las observaciones alrededor de la gran media y la divide en dos partes una explicada por lascias entre los distintos grupos (que corresponde a lo que llamamos varianza entre columnas)

no explicada por dichas diferencias (que corresponde a la varianza dentro de columnas) Estcisamente anaacutelogo a lo que acabamos de hacer en la ecuacioacuten 13-11Para el problema del IRS vemos que SCR ϭ 29109 (con k ϭ 3 grados de libertad) SCE

(con n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad) y que

F ϭ ϭ ϭ 11833

Los elementos en la columna ldquoMCrdquo son justo las sumas de cuadrados divididas entre sus glibertad Para 3 grados de libertad en el numerador y 6 en el denominador la tabla 6 del apeacutence que 978 es el liacutemite superior de la regioacuten de aceptacioacuten para un nivel de significancia El valor calculado de F 11833 estaacute muy por arriba de 978 de manera que se ve que la r

como un todo es altamente significativa Se puede llegar a la misma conclusioacuten si se observresultado del programa dice que ldquo prdquo es 0000 Debido a que este valor prob es menor que elsignificancia ϭ 001 se concluye que la regresioacuten completa es significativa De esta mapuede usar la p de ANOVA como prueba sin tener que utilizar la tabla 6 del apeacutendice para bvalor criacutetico de F Esto es anaacutelogo a la manera en que se usaron los valores de p en la figura ra probar la significancia de las variables explicativas individuales

Multicolinealidad en la regresioacuten muacuteltiple

En el anaacutelisis de regresioacuten muacuteltiple los coeficientes de regresioacuten a menudo se vuelven

confiables conforme aumenta el grado de correlacioacuten entre las variables independie

existe un alto nivel de correlacioacuten entre algunas de las variables independientes nos enfrenun problema que los estadiacutesticos llaman multicolinealidad

La multicolinealidad puede presentarse si deseamos estimar la recuperacioacuten de las ventaempresa y utilizamos tanto el nuacutemero de vendedores empleados como sus salarios totales Cvalores asociados con estas dos variables independientes tienen una correlacioacuten alta neceusar soacutelo un conjunto de ellos para realizar nuestra estimacioacuten De hecho al agregar una segriable que estaacute correlacionada con la primera se distorsionan los valores de los coeficientgresioacuten Sin embargo a menudo podemos predecir bien Y incluso cuando haya multicoline

Consideremos un ejemplo donde existe multicolinealidad para ver coacutemo afecta a la regresrante los 12 meses pasados el gerente del restaurante Pizza Shack ha estado poniendo unaanuncios en el perioacutedico local Los anuncios se programan y pagan el mes anterior a que ap

Un ejemplo demulticolinealidad

Definicioacuten y efecto dela multicolinealidad

9703ᎏ

0082

29109 3ᎏ

0491 6Prueba de lasignificancia de laregresioacuten en elproblema del Serviciode Contribuciones

Anaacutelisis devarianza parala regresioacuten

Prueba F de laregresioacuten como

un todo

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 29 1088 9 7029 118 52 0Er r or 6 0 4912 0 0819Tot al 9 29 6000

FIGURA 13-5Salida de Minitabanaacutelisis devarianza

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2556

Cada anuncio contiene un cupoacuten que permite llevarse dos pizzas pagando solamente la de mcio El gerente recolectoacute los datos de la tabla 13-4 y le gustariacutea utilizarlos para predecir las vpizzas

En las figuras 13-6 y 13-7 se dieron los resultados de Minitab para las regresiones respelas ventas totales sobre el nuacutemero de anuncios y sobre el costo

Para la regresioacuten sobre el nuacutemero de anuncios tenemos que el valor t observado es 395grados de libertad y un nivel de significancia de ϭ 001 se encontroacute que el valor t criacuteticdo de la tabla 2 del apeacutendice) es 3169 Como t o Ͼ t c (o de manera equivalente como p es m001) concluimos que el nuacutemero de anuncios es una variable explicativa altamente signifilas ventas totales Note tambieacuten que r 2 ϭ 610 de modo que el nuacutemero de anuncios explximadamente el 61 de la variacioacuten en las ventas de pizzas

Para la regresioacuten sobre el costo de los anuncios el valor t observado es 454 de modo qude los anuncios es una variable explicativa de las ventas totales todaviacutea maacutes significativa que ro de anuncios (para los que el valor t observado fue soacutelo 395) En esta regresioacuten r 2 ϭ 673

el costo de los anuncios explica aproximadamente el 67 de la variacioacuten de las ventas de pizComo ambas variables explicativas son altamente significativas por siacute mismas intentam

zar ambas en una regresioacuten muacuteltiple El resultado se presenta en la figura 13-8La regresioacuten muacuteltiple es altamente significativa como un todo ya que la p de ANOVA e

Uso de ambas varia-bles explicativas enuna regresioacuten muacuteltiple

Dos regresionessimples

Datos de ventas y anun-cios para el restaurantePizza Shack

Tabla 13-4 X 1 X 2 Y

Nuacutemero Costo de anuncios Venta tode anuncios publicados de pizz

Mes publicados (cientos de doacutelares) (miles de d

Mayo 12 139 436

Junio 11 120 380

Julio 9 93 301

Agosto 7 97 353

Septiembre 12 123 464

Octubre 8 114 342

Noviembre 6 93 302

Diciembre 13 143 407

Enero 8 102 385

Febrero 6 84 226

Marzo 8 112 376

Abril 10 111 352

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esVENTAS = 16 9 + 2 08 ANUNCI OS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 16 937 4 982 3 40 0 007ANUNCI OS 2 0832 0 5271 3 95 0 003

s = 4 206 R- s q = 61 0

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 1 276 31 276 31 15 62 Er r or 10 176 88 17 69Tot a l 11 453 19

Figura 13-6

Regresioacuten de lasventas sobre elnuacutemero deanuncios conMinitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2656

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2756

gar el nuacutemero de anuncios como segunda variable explicativa ademaacutes del costo de los anuncios eplica nada maacutes alrededor del 1 adicional de la variacioacuten de las ventas totales

En este punto es justo preguntarse iquestqueacute variable realmente explica la variacioacuten de las ventotales en la regresioacuten muacuteltiple La respuesta es que ambas la explican pero no podemos separ

sus contribuciones individuales debido a que estaacuten altamente correlacionadas entre siacute E

consecuencia sus coeficientes en la regresioacuten muacuteltiple tienen errores estaacutendar altos valore

calculados relativamente bajos y valores prob Ͼ | t | relativamente altos

iquestDe queacute manera nos afecta esta multicolinealidad Todaviacutea podemos hacer predicciones relativmente precisas cuando se encuentra presente note que para la regresioacuten muacuteltiple (la salida se dala figura 13-8) el error estaacutendar de la estimacioacuten que determina el ancho de los intervalos de co

fianza para las predicciones es 3989 mientras que para la regresioacuten simple con el costo de los anucios como variable explicativa (salida en la figura 13-7) tenemos se ϭ 3849 Lo que no podemhacer es predecir con mucha precisioacuten coacutemo cambiaraacuten las ventas si aumentamos en uno el nuacutemede anuncios La regresioacuten muacuteltiple dice que b1 ϭ 0625 (esto es cada anuncio aumenta las ventotales de pizzas alrededor de $625) pero el error estaacutendar de este coeficiente es 112 (es decir apximadamente $1120)

Las contribucionesindividuales nopueden separarse

Ejercicios 134

Ejercicios de autoevaluacioacuten

EA 13-4 Edith Pratt es una ocupada ejecutiva de una compantildeiacutea de transporte de carga a nivel nacional y va tara una junta porque no encuentra la salida de la regresioacuten muacuteltiple elaborada por un asistente Si la regsioacuten total es significativa al nivel 005 ella desea usar las salida de computadora como evidencia para fudamentar algunas ideas que expondraacute en la reunioacuten Sin embargo su ayudante estaacute enfermo De hectoda la informacioacuten que tiene de la regresioacuten muacuteltiple es un trozo de papel con los siguientes datos

Regresioacuten paraEdith Pratt

SCR 8724 con gl

SCE con 17 gl

SCT 10236 con 24 gl

Como el papel ni siquiera tiene todos los nuacutemeros Edith ha concluido que no es uacutetil Usted sin embardebe saber maacutes que ella iquestPuede Edith entrar en la junta o debe seguir buscando la salida de computador

EA 13-5 Una pequentildea liacutenea aeacuterea de Nueva Inglaterra realizoacute una encuesta sobre sus 15 terminales y obtuvo losguientes datos para el mes de febrero donde

VENTAS ϭ ingreso total seguacuten el nuacutemero de boletos vendidos (en miles de doacutelares)

PROMOCϭ cantidad gastada en promociones de la liacutenea aeacuterea en el aacuterea (en miles de doacutelares)

COMPET ϭ nuacutemero de liacuteneas aeacutereas que compiten en esa terminal

GRATIS ϭ nuacutemero de pasajeros que vuelan gratis (por diferentes razones)

Sugerencia el concepto de hacer infe-rencias respecto a una regresioacuten muacutelti-ple es justo lo mismo que se hizo en elcapiacutetulo 12 cuando hicimos inferencias

respecto a una recta de regresioacuten excepto que ahora se em-

plean dos o maacutes variables independientes Advertencia lamulticolinealidad es un problema que debe manejarse enla regresioacuten muacuteltiple y es necesario desarrollar una com-prensioacuten con sentido comuacuten Recuerde que todaviacutea puedehacer predicciones precisas cuando estaacute presente Pero re-cuerde tambieacuten que no puede decir con mucha precisioacuten

cuaacutento cambiaraacute la variable dependiente si ldquomanipulardquo lavariables independientes Entonces el objetivo debe seminimizar la multicolinealidad Sugerencia la mejor regresioacuten muacuteltiple es la que explica la relacioacuten entre los datos asentildealar la responsabilidad de la mayor proporcioacuten de la va

riacioacuten en la variable dependiente con el menor nuacutemero dvariables independientes Advertencia no es una buenidea incluir demasiadas variables independientes soacutelo porque cuenta con una computadora y un paquete de softwarpara estadiacutestica

SUGERENCIAS

Y

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2856

Ventas (doacutelares) Promoc (doacutelares) Compet Gratis

793 25 10 3

2001 55 8 6

1632 60 12 9

2001 79 7 16

1460 52 8 15

1777 76 12 9

309 20 12 8

2919 90 5 10

1600 40 8 43394 96 5 16

1596 55 11 7

863 30 12 6

2375 60 6 10

1072 50 10 4

1550 35 10 4

a) Utilice la siguiente salida de Minitab para determinar la ecuacioacuten de regresioacuten que mejor se ara la liacutenea aeacuterea

La ec uaci oacuten de r egr es i oacuten esVENTAS ϭ 172 ϩ 25 9 PROMOVϪ 13 2 COMPET Ϫ 3 04 GRATI S

Pr onos t i cador Coef Des vEs t Coci ent e - t Cons t ant e 172 34 51 38 3 35 0PROMOV 25 950 4 877 5 32 0COMPET - 13 238 3 686 - 3 59 0GRATI S - 3 041 2 342 - 1 30 0

b) iquestLos pasajeros que vuelan gratis ocasionan una disminucioacuten significativa en las ventas Fpruebe las hipoacutetesis apropiadas Use ϭ 005

c) iquestUn incremento de $1000 en las promociones cambia las ventas en $28000 o el cambio ecativamente diferente de $28000 Formule y pruebe las hipoacutetesis adecuadas Use ϭ 010

d) Calcule un intervalo de confianza del 90 para el coeficiente de la pendiente de la COMPET

Aplicaciones

13-22 Mark Lowtown publica el perioacutedico Mosquito Junction Enquirer y tiene problemas para predectidad de papel perioacutedico que necesita imprimir diariamente Eligioacute aleatoriamente 27 diacuteas del arior y registroacute la siguiente informacioacuten

PESO ϭ peso en libras de papel perioacutedico para la edicioacuten de ese diacutea

CLASIFICADOS ϭ nuacutemero de anuncios clasificados

PUBLICIDAD ϭ nuacutemero de anuncios publicitarios

PLANA COMPLETA ϭ nuacutemero de anuncios a una plana

Utilizando Minitab para hacer una regresioacuten de PESO sobre las otras tres variables Mark obtuguiente salida

Pr onos t i cador Coef Des vEs t Coci ent e- t Cons t ant e 1072 95 872 43 1 23 0CLASI FI CADOS 0 251 0 126 1 99 0PUBLI CI DAD 1 250 0 884 1 41 0PLANA COMPLETA 250 66 67 92 3 69 0

a) Mark siempre ha pensado que cada anuncio publicitario utiliza al menos 3 libras de papel iquestsioacuten le da una razoacuten significativa para dudar esto al nivel del 5

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2956

b) De manera similar Mark siempre ha creiacutedo que cada anuncio clasificado utiliza aproximmedia libra de papel iquestTiene ahora Mark una razoacuten significativa para dudar esto al nivel del

c) Mark vende espacios de anuncios de plana completa a los comerciantes locales a $30 la paacutegberaacute pensar en ajustar sus tarifas si el papel perioacutedico le cuesta $009 por libra Suponga costos son despreciables Establezca expliacutecitamente las hipoacutetesis y una conclusioacuten (Sugere

jando todo lo demaacutes constante cada anuncio adicional de plana completa tiene un costo de bras de papel ϫ $009 por libra ϭ $2256 El punto de equilibrio es 333333 libras iquestPor quel coeficiente de pendiente para PLANA COMPLETA es significativamente mayor que Mark no estaacute obteniendo ganancias y debe cambiar sus tarifas)

13-23 Para los datos del ejercicio 13-18 y un nivel de significancia de 010 iquestcuaacuteles variables son sign

mente explicativas de los resultados de los exaacutemenes (Habiacutea 12 estudiantes en la muestra) 13-24 Para los datos del ejercicio 13-18 y la siguiente salida de Minitab del procedimiento de regresiple hecho por Bill

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 3134 42 783 60Er r or 7 951 25 135 89Tot a l 11 4085 67

a) iquestCuaacutel es el valor observado de F b) A un nivel de significancia de 005 iquestcuaacutel es el valor criacutetico de F que se debe utilizar para d

si la regresioacuten como un todo es significativac) Basaacutendose en las respuestas a los incisos a) y b) iquestes la regresioacuten significativa como un tod

13-25 Remiacutetase al ejercicio 13-19 A un nivel de significancia de 001 iquestes la variable DISTANCIA uble explicativa significativa para VENTAS

13-26 Para los datos del ejercicio 13-19 y la siguiente salida adicional de Minitab al correr la regresioacuten

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 2861495 715374 102 39 0Er r or 18 125761 6896 7Tot a l 22 2987256

Al nivel de significancia de 005 iquestes la regresioacuten significativa como un todo

13-27 Henry Lander es el director de produccioacuten de la Alecos Corporation de Caracas Venezuela Hede que le ayude a determinar una foacutermula para predecir el ausentismo de los empacadores de chipoacutetesis es que la temperatura diaria promedio puede explicar el porcentaje de ausentismo Durios meses reuacutene datos ejecuta el procedimiento de regresioacuten simple y encuentra que la tempeplica 66 de la variacioacuten en el ausentismo Pero Henry no estaacute convencido de que eacuteste sea un cador satisfactorio Sugiere que la precipitacioacuten pluvial diaria podriacutea tambieacuten tener algo que vausentismo de modo que registra los datos correspondientes y hace una regresioacuten del ausentismte el tiempo de lluvias y obtiene un valor R2 de 059 ldquoiexclEurekardquo grita usted ldquoiexclLo tengo Con uticador que explica 66 y otro que explica 59 todo lo que tengo que hacer es una regresioacutenutilizando ambos y seguramente tendreacute un pronosticador casi perfectordquo Para su desaacutenimo sin la regresioacuten muacuteltiple tiene una R

2 de soacutelo 68 que es solamente un poco mejor que la variablperatura sola iquestCoacutemo puede explicar esta aparente discrepancia

13-28 Juan Armenlegg administrador de Rockyrsquos Diamond y Jewelry Store estaacute interesado en desamodelo para estimar la demanda del consumidor para su costosa mercanciacutea Como la mayoriacutea de

tes compran diamantes y joyas a creacutedito Juan estaacute seguro de que dos factores que deben influirmanda de los clientes son la tasa real de inflacioacuten anual y la tasa real de intereses sobre preacutestamprincipales bancos del paiacutes Explique algunos problemas que Juan podriacutea encontrar si fuera a dun modelo de regresioacuten basado en estas dos variables de prediccioacuten

13-29 Un nuevo programa de juegos Check That Model pide a los concursantes que especifiquen el nuacutenimo de paraacutemetros que necesitan para determinar si un modelo de regresioacuten muacuteltiple es signifimo un todo para ϭ 001 Usted ganoacute la apuesta con 4 paraacutemetros Use la siguiente informacioacutenterminar si la regresioacuten es significativa

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3056

R 2

ϭ 07452

SCE ϭ 1254

n ϭ 18

Nuacutemero de variables independientes ϭ 3

13-30 La Scottish Turist Agency estaacute interesada en el nuacutemero de turistas que entran al paiacutes cada semanrante la temporada alta Se recolectaron los siguientes datos

Turistas (Y ) ϭ nuacutemero de turistas que entran a Escocia en una semana (en miles)

Cambio (X 1)ϭ nuacutemero de libras escocesas compradas por $1 doacutelar

Precio (X 2) ϭ nuacutemero de libras escocesas cobradas por viaje redondo en camioacuten de Londres a Edimburgo

Promoc (X 3) ϭ cantidad gastada en promocioacuten del paiacutes (en miles de libras escocesas)Temp (X 4) ϭ temperatura media durante la semana en Edimburgo (en grados Celsius)

Turistas (Y ) Cambio (X 1) Precio (X 2) Promoc (X 3) Temp (X 4)

69 061 40 87 154

71 059 40 88 156

68 063 40 85 154

79 061 35 86 153

76 060 35 94 158

82 065 35 99 162

80 058 35 98 164

84 059 35 102 166

97 061 30 114 174

98 062 30 116 172

72 057 40 84 176

67 055 40 86 164

a) Utilice el paquete de software que tenga para determinar la ecuacioacuten de regresioacuten que mejote a los datos de la agencia de turismo

b) iquestEs la tasa de cambio una variable explicativa significativa Establezca y pruebe las hipoacutetesidas a un nivel de significancia de 010

c) Un incremento de 1000 libras en las promociones iquestaumenta el nuacutemero de turistas en maacutesEstablezca y pruebe las hipoacutetesis adecuadas para un nivel de significancia de 005

d) Calcule un intervalo de confianza del 95 para el coeficiente de la pendiente de Temp

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-4 Como SCT ϭ SCR ϩ SCE SCE ϭ SCT Ϫ SCR ϭ 10236 Ϫ 8724 ϭ 1512Como gl SCT ϭ gl SCR ϩ gl SCE gl SCR ϭ gl SCT Ϫ gl SCE ϭ 24 Ϫ 17 ϭ 7

Entonces F ϭ ϭ ϭ 1401

F CRiacuteT ϭ F (7 17 005) ϭ 261Como F OBS gt F CRIacuteT se concluye que la regresioacuten es significativa como un todo Edith debe conticando la salida de computadora de la regresioacuten para usarla en la junta

EA 13-5 De la salida de computadora se obti enen los siguientes resultadosa) VENTAS ϭ 17234 ϩ 25950PROMOC Ϫ13238COMPET Ϫ 3041GRATISb) H0 BGRATIS ϭ 0 H1 BGRATIS Ͻ 0 ϭ 005

Eacutesta es una prueba de una cola y el valor prob en los resultados es para la alternativa de dos c BGRATIS 0 De manera que para esta prueba el valor prob es 02212 ϭ 0111 Ͼ ϭ 00que no se puede rechazar H0 las ventas no disminuyen significativamente cuando aumenta ro de pasajeros que vuelan gratis

c) H0 BPROMOC ϭ 28 H1 BPROMOC 28 ϭ 010

87247ᎏᎏ

151217SCRk ᎏᎏ

SCE(n Ϫ k Ϫ 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3156

El valor observado t de los resultados de regresioacuten es

ϭ ϭ Ϫ0420

Con 11 grados de libertad y ϭ 010 en ambas colas combinadas los valores criacuteticos t parba son Ϯ1796 asiacute el valor observado estaacute dentro de la regioacuten de aceptacioacuten No se rechacambio en VENTAS para un incremento de una unidad ($1000) en PROMOC no es significate diferente de 28 ($28000)

d) Con 11 grados de libertad el valor t para un intervalo del 90 de confianza es 1796 por lo

tervalo esbCOMP Ϯ 1796sbCOMP

ϭ Ϫ13238 Ϯ 1796(3686)

ϭ Ϫ13238 Ϯ 6620 ϭ (Ϫ19858 Ϫ 6618)

La liacutenea aeacuterea puede tener una seguridad del 90 de que el ingreso por los boletos en una ofminuye entre $6600 y $19900 aproximadamente con cada liacutenea aeacuterea adicional que comp

135 Teacutecnicas de modelado

Dada una variable que deseamos explicar y un conjunto de variables explicativas potencialehaya varias ecuaciones de regresioacuten diferentes que podamos estudiar dependiendo de queacute explicativas incluyamos y de coacutemo lo hagamos Cada una de esas ecuaciones de regresioacutence como modelo Las teacutecnicas de modelado son las distintas formas en que podemos incluriables explicativas y verificar queacute tan apropiados son los modelos de regresioacuten Existen municas de modelado diferentes pero soacutelo veremos dos de las maacutes utilizadas

Datos cualitativos y variables ficticias

En todos los ejemplos de regresioacuten que hemos visto hasta ahora los datos manejados hanmeacutericos o cuantitativos Pero ocasionalmente nos enfrentaremos con una variable categoacuterilitativa En el problema del inicio el capiacutetulo el director de personal desea ver si el salarioun vendedor depende de su sexo En la tabla 13-5 repetimos los datos de dicho problema

Por el momento ignore la antiguumledad y utilice la teacutecnica desarrollada en el capiacutetulo 9 bar la diferencia entre las medias de dos poblaciones para ver si los hombres ganan maacutes qu

jeres Pruebe con ϭ 001 Si tomamos a los hombres como la poblacioacuten 1 y a las mujerespoblacioacuten 2 probaremos las siguientes hipoacutetesis

H0 1 ϭ 2 larr Hipoacutetesis nula no existe discriminacioacuten por sexo en los salarios base

H1 1 Ͼ 2 larr Hipoacutetesis alternativa se discrimina a las mujeres en su salario base

ϭ 001 larr Nivel de significancia

Revisioacuten del enfoqueanterior del problema

Buacutesqueda dediferentes modelos

25950 Ϫ 28ᎏᎏ

4877

(bPROMOC Ϫ 28)ᎏᎏ

sbPROMOC

Datos para el problemade discriminacioacuten porsexo

Tabla 13-5 Vendedores VendedorasAntiguumledad Salario base Antiguumledad Salario base(en meses) (en miles) (en meses) (en miles)

6 75 5 62

10 86 13 87

12 91 15 94

18 103 21 98

30 130

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3256

A continuacioacuten bosquejamos el anaacutelisis Si tiene problemas para seguirlo deberaacute repasamente la seccioacuten 93

n1 ϭ 5 n2 ϭ 4

x ෆ1 ϭ 97 x ෆ2 ϭ 8525

s2

1 ϭ 4415 s2

2 ϭ 2609

s2

p ϭ

ϭ

ϭ 3641

x ෆ1Ϫ x

ෆ2ϭ s pΊ ϩ

ϭ 128

t ϭ

ϭ

ϭ 092

Con siete grados de libertad el valor t criacutetico para una prueba de cola superior con ϭ 001 eComo el valor t observado de 092 es menor que 2998 no podemos rechazar H0

Entonces el anaacutelisis concluye que no parece haber discriminacioacuten por sexo en los salarPero recuerde que hasta ahora se han ignorado los datos de antiguumledad laboral para el anaacuteli

Antes de seguir vea el diagrama de dispersioacuten de los datos En la figura 13-9 los punto

corresponden a los hombres y los blancos a las mujeres El diagrama de dispersioacuten muestraridad que el salario base aumenta con los antildeos de antiguumledad pero si con la mirada sigue lo qla recta de regresioacuten notaraacute que los puntos negros tienden a estar arriba de ella y los blancos

La figura 13-10 da la salida de una regresioacuten del salario base sobre los meses de antiguumlelos resultados se ve que la antiguumledad es una variable explicativa altamente significativa

Ademaacutes r 2

ϭ 926 que indica que la variable meses de antiguumledad explica cerca del 9variacioacuten en el salario base La figura 13-11 contiene parte de la salida que no se vio antesbla de residuos Para cada punto el residuo es simplemente Y Ϫ Y ˆ que se reconoce como el

Una ldquomiradardquo a los

datos

El enfoque anterior nodetecta discriminacioacuten

(97 ndash 8525) ndash 0ᎏᎏ

128

( x ෆ1 ndash x ෆ2) ndash (1 Ϫ 2)H0

ᎏᎏᎏ

ˆ x ෆ1Ϫ

x ෆ2

1ᎏ

n2

1ᎏ

n1

4(4415) ϩ 3(2609)ᎏᎏᎏ5 ϩ 4 ndash 2

(n1 ndash 1)s21 ϩ (n2 ndash 1)s22ᎏᎏᎏ

n1 ϩ n2 ndash 2

FIGURA 13-9

Diagrama de dis-persioacuten de salariosbase contra mesesde antiguumledad

4 8 12 16 20 24 28

4

8

12

Meses de antiguumledad

S a l a r i o ( m i l e s d e d oacute l a r e s )

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3356

el ajuste de la recta de regresioacuten en ese punto En la figura 13-11 AJUST1 son los valores y RESI1 son los residuos

Tal vez la parte maacutes importante del anaacutelisis del resultado de una regresioacuten sea estusiduos Si la regresioacuten incluye todos los factores explicativos relevantes estos residuo

ser aleatorios Dicho de otro modo si los residuos muestran cualquier patroacuten no aleat

to indica que hay algo sistemaacutetico que afecta el proceso y que no hemos tomado en cu

manera que buscamos patrones en los residuos o para decirlo de forma maacutes pintoresca ldquopmos a los residuos hasta hacerlos hablarrdquo

Si observamos los residuos presentados en la figura 13-11 vemos que los primeros cincoson positivos De modo que para los vendedores tenemos Y ndash Y ˆ Ͼ 0 o Y Ͼ Y ˆ es decir laregresioacuten cae abajo de estos cinco puntos Tres de los cuatro uacuteltimos residuos son negaticonsiguiente para las vendedoras tenemos Y Ϫ Y ˆ Ͻ 0 o Y Ͻ Y ˆ asiacute que la recta de regresicuentra arriba de tres de los cuatro puntos Esto confirma lo que vimos al observar el diagdispersioacuten de la figura 13-9 Este patroacuten no aleatorio en los residuos sugiere que el sexo siacute etor determinante del salario base

iquestCoacutemo podemos incorporar el sexo de los vendedores dentro del modelo de regresioacutencemos utilizando un dispositivo llamado variable ficticia (o variable indicadora) Para lpuntos que representan a los vendedores esta variable tiene valor de 0 y para los cuatro purepresentan a las vendedoras valdraacute 1 Los datos de entrada para nuestra regresioacuten con variticias se dan en la tabla 13-6

Para los datos de la tabla 13-6 se ajusta una regresioacuten de la forma

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

Uso de variablesficticias

Deteccioacuten depatrones en losresiduos

ldquoPresionar a losresiduosrdquo

Anaacutel i s i s de r e gr e s i oacuten

La ec uac i oacuten de r e gr es i oacuten esSALARI O ϭ 5 81 ϩ 0 233 MESES

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t pCons t a nt e 5 8093 0 4038 14 39 0 000MESES 0 23320 0 02492 9 36 0 000

s ϭ 0 5494 R- s q ϭ 92 6

Anaacute l i s i s de va r i a nz aFUENTE GL SC MC F Re gr e s i oacuten 1 26 443 24 443 87 61 0Er r or 7 2 113 0 302Tot a l 8 28 556

FIGURA 13-10

Regresioacuten conMinitab del salariobase sobre losmeses deantiguumledad

RENGLOacuteN SALARI O AJ UST1 RESI 1

1 7 5 7 2085 0 2914992 8 6 8 1413 0 458684

3 9 1 8 6077 0 4922764 10 3 10 0069 0 2930545 13 0 12 8054 0 1946076 6 2 6 9753 - 0 7752977 8 7 8 8409 - 0 1409288 9 4 9 3073 0 0926649 9 8 10 7066 - 0 906558

FIGURA 13-11

Tabla de residuosde Minitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 456

En este problema X 1 representa el nuacutemero de horas de trabajo de auditoriacutea de campo y X 2 el nuacute-mero de horas en computadora La variable dependiente Y seraacute los impuestos reales no pagados des-cubiertos

Recuerde que en la regresioacuten simple la ecuacioacuten de estimacioacuten Y ˆ ϭ a ϩ bX describe la relacioacutenentre las dos variables X y Y En regresioacuten muacuteltiple debemos extender esa ecuacioacuten agregando unteacutermino para cada nueva variable En siacutembolos la ecuacioacuten 13-1 es la foacutermula que se usa cuando te-nemos dos variables independientes

Ecuacioacuten deestimacioacuten pararegresioacuten muacuteltiple

Definicioacuten de lasvariables

Datos de los registros deauditoriacuteas del IRS de losuacuteltimos 10 meses

Tabla 13-1 X 1 X 2 Y

Horas de trabajo de Horas en Impuestos realesauditoriacutea de campo computadora no pagados descubiertos

Mes (dos ceros omitidos) (dos ceros omitidos) (millones de doacutelares)

Enero 45 16 29

Febrero 42 14 24

Marzo 44 15 27

Abril 45 13 25

Mayo 43 13 26

Junio 46 14 28

Julio 44 16 30Agosto 45 16 28

Septiembre 44 15 28

Octubre 43 15 27

Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 [13-1]

Ecuaciones normales

Y ϭ na ϩ b1 X 1 ϩb2 X 2 [13-2]

X 1Y ϭ a X 1 ϩ b1 X 2

1 ϩb2 X 1 X 2 [13-3]

X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩb2 X 2

2 [13-4]

donde

bull Y ˆ ϭ valor estimado correspondiente a la variable dependientebull a ϭ ordenada Y

bull X 1 y X 2 ϭ valores de las dos variables independientesbull b1 y b2 ϭ pendientes asociadas con X 1 y X 2 respectivamente

Podemos visualizar la ecuacioacuten de estimacioacuten simple como una recta en una graacutefica de manerasimilar podemos representar una ecuacioacuten de regresioacuten muacuteltiple de dos variables como un plano

como el que ilustra la figura 13-1 Se trata de una forma o figura tridimensional con profundidadlargo y ancho Para obtener una idea intuitiva de esta forma tridimensional visualice la interseccioacutende los ejes Y X 1 y X 2 como un rincoacuten de una habitacioacuten

La figura 13-1 es una graacutefica de los 10 puntos de la muestra y el plano alrededor del cual estospuntos parecen agruparse Algunos estaacuten arriba del plano y otros abajo del mismo modo que los pun-tos estaban arriba y abajo de la recta de regresioacuten simple

Nuestro problema consiste en decidir cuaacutel de los planos que podemos dibujar seraacute el que mejorse ajuste Para hacer esto de nuevo utilizaremos el criterio de miacutenimos cuadrados y localizaremosel plano que minimice la suma de los cuadrados de los errores es decir de las distancias de los pun-tos alrededor del plano a los puntos correspondientes sobre el plano Usemos nuestros datos y las si-guientes tres ecuaciones para determinar los valores de las constantes numeacutericas a b1 y b2

Uso del criterio demiacutenimos cuadradospara ajustar un planode regresioacuten

Visualizacioacuten de laregresioacuten muacuteltiple

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 556

Error Punto correspondienteen el plano

Punto observado

Plano formado a traveacutesde los puntos de la muestraY = a + b 1X 1 + b 2X 2^

a = ordenada Y

X 1

X 2

Y FIGURA 13-1

Plano de regresioacutenmuacuteltiple para 10datos

Podemos obtener a b1 y b2 los coeficientes del plano de regresioacuten resolviendo las ec13-2 13-3 y 13-4 Obviamente la mejor manera de calcular todas las sumas implicadas en ecuaciones es elaborar una tabla para recolectar y organizar la informacioacuten necesaria comen la regresioacuten simple Esto se presenta en la tabla 13-2 para el problema del IRS

Ahora utilizando la informacioacuten de la tabla 13-2 en las ecuaciones 13-2 13-3 y 13-4 obtres ecuaciones con tres constantes desconocidas (a b1 y b2)

272 ϭ 10a ϩ 441b1 ϩ 147b2

12005 ϭ 441a ϩ 19461b1 ϩ 6485b2

4013 ϭ 147a ϩ 6485b1 ϩ 2173b2

Cuando resolvemos estas tres ecuaciones de manera simultaacutenea obtenemos

a ϭ Ϫ13828

b1 ϭ Ϫ 0564

b2 ϭ Ϫ 1099

Sustituyendo estos tres valores en la ecuacioacuten de regresioacuten de dos variables (ecuacioacuten 13-l)mos una ecuacioacuten que describe la relacioacuten entre el nuacutemero de horas de trabajo en auditoriacuteaspo el nuacutemero de horas de computacioacuten y los impuestos no pagados descubiertos por el dep

to de auditoriacuteasY ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

ϭ Ϫ13828 ϩ 0564 X 1 ϩ 1099 X 2

El departamento de auditoriacuteas puede utilizar esta ecuacioacuten mensualmente para estimardad de impuestos no pagados que va a descubrir

Suponga que el IRS desea aumentar la cantidad de detecciones de impuestos no pagados ete mes Como los auditores capacitados son escasos el IRS no tiene la intencioacuten de contratnal adicional El nuacutemero de horas de trabajo en auditoriacuteas entonces permaneceraacute en el niv

Uso de la ecuacioacutende regresioacuten muacuteltiplepara estimaciones

Obtencioacuten de a b 1y b 2 resolviendo lasecuaciones 13-213-3 y 13-4

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 656

tubre alrededor de 4300 horas Pero con el fin de aumentar las detecciones de impuestos no p

el IRS espera aumentar el nuacutemero de horas en computadora a cerca de 1600 Como resultad X 1 ϭ 43 larr 4300 horas de trabajo en auditoriacuteas de campo

X 2 ϭ 16 larr 1600 horas de tiempo en computadora

Sustituyendo estos valores en la ecuacioacuten de regresioacuten para el departamento de auditoriacuteanemos

Y ˆ ϭ Ϫ13828 ϩ 0564 X 1 ϩ 1099 X 2

Y ˆ ϭ Ϫ13828 ϩ (0564)(43) ϩ (1099)(16)

Y ˆ ϭ Ϫ13828 ϩ 24252 ϩ 17584

Y ˆ ϭ 28008 larr Detecciones estimadas de $28008000

Por tanto en el pronoacutestico para noviembre el departamento de auditoriacuteas espera enconevasioacuten de impuestos cercana a 28 millones de doacutelares para esta combinacioacuten de factores

Hasta este punto nos hemos referido a a como la ordenada Y y a b1 y b2 como las pendieplano de regresioacuten muacuteltiple Pero para ser maacutes precisos debemos decir que estas constantericas son los coeficientes de regresioacuten estimados La constante a es el valor de Y ˆ (en este catimacioacuten de los impuestos no pagados) si tanto X 1 como X 2 tienen valor cero Los coeficienb2 describen coacutemo los cambios en X 1 y X 2 afectan el valor de Y ˆ En el ejemplo del IRS pode

jar constante el nuacutemero de horas de trabajo de auditoriacutea de campo X 1 y cambiar el nuacutemerras en computadora X 2 Cuando hacemos esto el valor de Y ˆ aumenta en $1099000 por choras adicionales de tiempo en computadora Del mismo modo podemos fijar X 2 y encon

por cada aumento adicional de 100 horas en el nuacutemero de horas de trabajo de auditoriacuteas deY ˆ aumenta $564000

a b 1 y b 2 son loscoeficientes de re-gresioacuten estimados

Interpretacioacuten de laestimacioacuten

Sugerencia si tiene problemas para vi-sualizar lo que hace en realidad la regre-sioacuten muacuteltiple piense en el capiacutetulo 12 yrecuerde que una recta de regresioacuten des-

cribe la relacioacuten entre dos variables En la regresioacuten muacutelti-ple el plano de regresioacuten como el que se ve en la paacuteginaanterior describe la relacioacuten entre tres variables Y X 1 y X 2El concepto del plano de regresioacuten adecuado es el mismo

que el de la recta de regresioacuten adecuada es decir el qnimiza la suma de los cuadrados de las distancias vles entre los puntos de los datos y el plano en este cavez sea uacutetil recordar que cada variable independienteser responsable de cierta variacioacuten en la variable diente La regresioacuten muacuteltiple es soacutelo una manera dvarias variables independientes para hacer un promejor de la variable dependiente

SUGERENCIAS

Y

SUPOSICIONES

Valores para ajustarel plano de miacutenimoscuadrados donden ϭ 10

Tabla 13-2 Y X 1 X 2 X 1Y X 2Y X 1Y 2 X 2

1 X 2

2

(1) (2) (3) (2) ϫ (1) (3) ϫ (1) (2) ϫ (3) (2)2 (3)2

29 45 16 1305 464 720 2025 256

24 42 14 1008 336 588 1764 196

27 44 15 1188 405 660 1936 225

25 45 13 1125 325 585 2025 169

26 43 13 1118 338 559 1849 169

28 46 14 1288 392 644 2116 196

30 44 16 1320 480 704 1936 256

28 45 16 1260 448 720 2025 256 28 44 15 1232 420 660 1936 225

27 43 15 1161 405 645 1849 225

272 441 147 12005 4013 6485 19461 2173 7uarr uarr uarr uarr uarr uarr uarr uarr

Y X 1 X 2 X 1Y X 2Y X 1X 2 X 21 X 22

Y ෆ ϭ 272

X ෆ1 ϭ 441

X ෆ2 ϭ 147

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 756

Ejercicios 132

Ejercicios de autoevaluacioacutenEA 13-1 Dado el siguiente conjunto de datos

a) Calcule el plano de regresioacuten muacuteltipleb) Prediga Y cuando X 1 ϭ 30 y X 2 ϭ 27

Y X 1 X 2

25 35 50

30 67 4211 15 85

22 03 14

27 46 36

19 20 13

EA 13-2 Se ha reunido la siguiente informacioacuten de una muestra aleatoria de arrendadores de departamentos en uciudad Se intenta predecir la renta (en doacutelares por mes) con base en el tamantildeo del departamento (nuacutemro de habitaciones) y la distancia al centro de la ciudad (en millas)

Renta Nuacutemero de Distancia(doacutelares) habitaciones al centro

360 2 1

1000 6 1450 3 2

525 4 3

350 2 10

300 1 4

a) Calcule la ecuacioacuten de miacutenimos cuadrados que relacione mejor estas tres variablesb) Si alguien busca un departamento de dos habitaciones a 2 millas del centro iquestqueacute renta debe esperar pag

Conceptos baacutesicos 13-7 Dado el siguiente conjunto de datos

a) Calcule el plano de regresioacuten muacuteltipleb) Pronostique Y cuando X 1 ϭ 105 y X 2 ϭ 136

Y X 1 X 2

114 45 132

166 87 187

205 126 198

294 197 254

76 29 228

138 67 178

285 174 146

13-8 Para el siguiente conjunto de datosa) Calcule el plano de regresioacuten muacuteltipleb) Prediga Y cuando X 1 ϭ 28 y X 2 ϭ 10

Y X 1 X 2

10 8 4

17 21 9

18 14 11

26 17 20

35 36 13

8 9 28

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 856

13-9 Dado el siguiente conjunto de datosa) Calcule el plano de regresioacuten muacuteltipleb) Pronostique Y cuando X 1 ϭ Ϫ1 y X 2 ϭ 4

Y X 1 X 2

6 1 3

10 3 Ϫ1

9 2 4

14 Ϫ2 7

7 3 2

5 6 Ϫ4

Aplicaciones

13-10 Sam Spade duentildeo y gerente general de Stationery Store estaacute preocupado por el comportamienventas de un modelo de reproductor de CD y casetes que se venden en la tienda Se da cuenta de ten muchos factores que podriacutean ayudar a explicarlo pero cree que la publicidad y el precio soncipales determinantes Sam reunioacute los siguientes datos

Ventas Publicidad Precio(unidades vend) (nuacutem de anuncios) (doacutelares)

33 3 125

61 6 115

70 10 140

82 13 130

17 9 145

24 6 140

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir las ventas a partir de la publicidad y b) Si la publicidad es 7 y el precio es $132 iquestqueacute ventas podriacutea pronosticar

13-11 Un productor de comida para cerdos desea determinar queacute relacioacuten existe entre la edad de un cerdo empieza a recibir un complemento alimenticio de reciente creacioacuten el peso inicial del anima

mento de peso en un periodo de una semana con el complemento alimenticio La siguiente infoes resultado de un estudio de ocho lechones

X 1 X 2 Y

Nuacutemero Peso inicial Edad inicial Aumentode lechoacuten (libras) (semanas) de peso

1 39 8 7

2 52 6 6

3 49 7 8

4 46 12 10

5 61 9 9

6 35 6 5

7 25 7 38 55 4 4

a) Calcule la ecuacioacuten de miacutenimos cuadrados que mejor describa estas tres variablesb) iquestCuaacutento podemos esperar que un cerdo aumente de peso en una semana con el complemento

ticio si teniacutea nueve semanas de edad y pesaba 48 libras 13-12 Una estudiante graduada que quiere comprar un auto Neptune usado investigoacute los precios Pien

antildeo del modelo y el nuacutemero de millas recorridas influyen en el precio de compra Los datos siguirresponden a 10 autos con precio (Y ) en miles de doacutelares antildeo ( X 1) y millas recorridas ( X 2) en ma) Encuentre (calcule) la ecuacioacuten de miacutenimos cuadrados que mejor relacione estas tres variabb) La estudiante desea comprar un Neptune 1991 con alrededor de 40000 millas recorridas

pronostica que pagaraacute

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 956

(Y ) X 2

Precio X 1 Millas(miles de doacutelares) Antildeo (miles)

299 1987 556

602 1992 184

887 1993 213

392 1988 469

955 1994 118

905 1991 364

937 1992 282

42 1988 44248 1989 349

574 1991 264

13-13 La Reserva Federal de Estados Unidos realiza un estudio preliminar para determinar la relacioacuten etos indicadores econoacutemicos y el cambio porcentual anual en el producto interno bruto (PIB) Dindicadores examinados son el monto del deacuteficit del gobierno federal (en miles de millones de del promedio industrial Dow Jones (el valor medio del antildeo) Los datos correspondientes a seis antilde

Y X 1 X 2

Cambio en el PIB Deacuteficit federal Dow Jones

25 100 2850

Ϫ10 400 2100

40 120 330010 200 2400

15 180 2550

30 80 2700

a) Encuentre (calcule) la ecuacioacuten de miacutenimos cuadrados que mejor describa los datosb) iquestQueacute porcentaje de cambio en el PIB se esperariacutea en un antildeo en el cual el deacuteficit federal fue

millones de doacutelares y el promedio Dow Jones fue 3000

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-1 a) Y X 1 X 2 X 1Y X 2Y X 1X 2 X 2

1 X 2

2

25 35 50 875 1250 175 1225 2500

30 67 42 2010 1260 2814 4489 1764

11 15 85 165 935 1275 225 7225

22 03 14 66 308 042 009 196

27 46 36 1242 972 1656 2116 1296

19 20 13 380 247 260 400 169

1 ෆ3 ෆ4 ෆ 1 ෆ8 ෆ ෆ6 ෆ 2 ෆ4 ෆ ෆ0 ෆ 4 ෆ7 ෆ3 ෆ ෆ8 ෆ 4 ෆ9 ෆ7 ෆ ෆ2 ෆ 7 ෆ7 ෆ ෆ9 ෆ7 ෆ 8 ෆ4 ෆ ෆ6 ෆ4 ෆ 1 ෆ3 ෆ1 ෆ ෆ5 ෆ0 ෆ

Las ecuaciones 13-2 13-3 y 13-4 se convierten en

Y ϭ na ϩ b1 X 1 ϩ b2 X 2 134 ϭ 6 a ϩ 186b1 ϩ 240 b2

X 1Y ϭ a X 1 ϩ b1 X 21 ϩb2 X 1 X 2 4738 ϭ 186a ϩ 8464b1 ϩ 7797b2

X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22 4972 ϭ 240a ϩ 7797b1 ϩ 13150b2

Al resolver estas ecuaciones de manera simultaacutenea se obtiene

a ϭ 203916 b1 ϭ 23403 b2 ϭ Ϫ13283

De modo que la ecuacioacuten de regresioacuten es Y ˆ ϭ 203916 ϩ 23403 X 1 Ϫ 13283 X 2b) Con X 1 ϭ 30 y X 2 ϭ 27

Y ˆ = 203916 ϩ 23403(30) Ϫ 13283(27) ϭ 2883

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1056

EA 13-2 a) En este problema Y ϭ renta X 1 ϭ nuacutemero de habitaciones X 2 ϭ distancia al centro

Y X 1 X 2 X 1Y X 2Y X 1X 2 X 2

1 X 2

2 Y 2

360 2 1 720 360 2 4 1 129600

1000 6 1 600 1000 6 36 1 1000000

450 3 2 1350 900 6 9 4 202500

525 4 3 2100 1575 12 16 9 272625

350 2 10 700 3500 20 4 100 122500

300 1 4 300 1200 4 1 16 90000

2985 18 21 11170 8535 50 70 131 1820225

Las ecuaciones 13-2 13-3 y 13-4 se convierten en

Y ϭ na ϩ b1 X 1 ϩb2 X 2 2985 ϭ 6a ϩ 18b1 ϩ 21b2

X 1Y ϭ a X 1 ϩ b1 X 21 ϩb2 X 1 X 2 11170 ϭ 18a ϩ 70b1 ϩ 50b2

X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22 8535 ϭ 21a ϩ 50b1 ϩ 131b2

Al resolver estas ecuaciones simultaacuteneas se obtiene

a ϭ 964581 b1 ϭ 1364847 b2 ϭ Ϫ24035

De manera que la ecuacioacuten de regresioacuten es

Y ˆ ϭ 964581 ϩ 1364847 X 1 Ϫ 24035 X 2

b) Cuando el nuacutemero de habitaciones ϭ 2 y la distancia al centro ϭ 2

Y ˆ ϭ 964581 ϩ 1364847(2) Ϫ 24035(2) ϭ $365

133 La computadora y la regresioacutenmuacuteltiple

En el capiacutetulo 12 y hasta donde vamos de eacuteste hemos presentado problemas simplificados y muestrasde tamantildeo pequentildeo Despueacutes del ejemplo de la seccioacuten anterior probablemente usted haya llegadoa la conclusioacuten de que no estaacute interesado en la regresioacuten si tiene que hacer los caacutelculos a mano Dehecho conforme aumenta el tamantildeo de las muestras y crece el nuacutemero de variables independientespara la regresioacuten hacer los caacutelculos incluso con la ayuda de una calculadora de bolsillo se convier-te en algo muy inconveniente

Sin embargo como administradores debemos manejar problemas complejos que requieren mues-tras maacutes grandes y variables independientes adicionales Como ayuda para resolver estos problemasmaacutes detallados utilizaremos una computadora que nos permitiraacute realizar un gran nuacutemero de caacutelcu-los en poco tiempo

Suponga que tenemos no una ni dos variables independientes sino un nuacutemero k de ellas X 1

X 2 X k Como antes sea n el nuacutemero de datos que se tienen La ecuacioacuten de regresioacuten que inten-tamos estimar es

Inconvenienciadel caacutelculo deregresiones a mano

Ecuacioacuten de estimacioacuten de regresioacuten muacuteltiple

Y ˆ ϭ

b1 X 1ϩ

b2 X 2ϩ ϩ

bk X k [13-5]

Ahora veremos coacutemo podemos utilizar una computadora para estimar los coeficientes de regresioacutenPara demostrar coacutemo una computadora maneja el anaacutelisis de regresioacuten muacuteltiple tomemos el pro-

blema del Servicio Interno de Contribuciones (IRS) de la seccioacuten anterior Suponga que el departa-mento de auditoriacuteas agrega a su modelo la informacioacuten correspondiente a las recompensas para losinformantes La dependencia desea incluir esta tercera variable independiente X 3 debido a que sien-

Demostracioacuten de laregresioacuten muacuteltipleen la computadora

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1156

te que existe cierta relacioacuten entre estas recompensas y el descubrimiento de impuestos no pEn la tabla 13-3 se registroacute la informacioacuten de los uacuteltimos 10 meses

Para resolver este problema la divisioacuten de auditoriacutea usoacute el procedimiento de regresioacutende Minitab Por supuesto todaviacutea no sabemos coacutemo interpretar la solucioacuten que proporciocomo veremos la mayor parte de los nuacutemeros dados en la solucioacuten corresponden muy de c

los estudiados en el contexto de regresioacuten simple

Salida de Minitab

Una vez que se introducen los datos y se eligen las variables dependiente e independientescalcula los coeficientes de regresioacuten y varios estadiacutesticos asociados con la ecuacioacuten de regrveraacute la salida del programa para el problema del IRS La figura 13-2 da la primera parte de la

1 La ecuacioacuten de regresioacuten De los nuacutemeros dados en la columna Coef se puede leercioacuten de estimacioacuten

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ b3 X 3

ϭ Ϫ45796 ϩ 0597 X 1 ϩ 1177 X 2 ϩ 0405 X 3

Podemos interpretar esta ecuacioacuten en una forma similar a la de la ecuacioacuten de regresioacutevariables en la paacutegina 558 Si se mantienen constantes el nuacutemero de horas de audicampo X 1 y el nuacutemero de horas de computadora X 2 y se cambian las recompeninformantes X 3 entonces el valor de Y ˆ aumentaraacute $405000 por cada $1000 pagadosformantes De igual manera al mantener X 1 y X 3 constantes se ve que por cada 1adicionales de tiempo de computadora Y ˆ aumentaraacute $1177000 Por uacuteltimo si se dej

Buacutesqueda e interpre-tacioacuten de la ecuacioacutende regresioacuten

Salida del programaMinitab

Uso de Minitab pararesolver problemasde regresioacuten muacuteltiple

Factores relacionadoscon el descubrimientode impuestos nopagados

Tabla 13-3 Horas en Impueauditoriacuteas Horas Recompensa pagde campo en computadora a informantes descub(cientos) (cientos) (miles) (mill

Mes X 1 X 2 X 3

Enero 45 16 71 2

Febrero 42 14 70 2

Marzo 44 15 72 2

Abril 45 13 71 2

Mayo 43 13 75 2

Junio 46 14 74 2

Julio 44 16 76 3

Agosto 45 16 69 2

Septiembre 44 15 74 2

Octubre 43 15 73 2

FIGURA 13-2

Salida de Minitabpara la regresioacuten

del ServicioInterno deContribuciones

Anaacutel i s i s de r e gr e s i oacuten

La ec ua ci oacuten de r egr es i oacuten es

DESCUBRE ϭ mdash45 0 ϩ 0 597 AUDI T ϩ 1 18 COMPUTADORA ϩ 0 405 RECOMPENS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e Ϫ45 796 4 878 Ϫ9 39 0 000AUDI T 0 50697 0 08112 7 36 0 000COMPUTADORA 1 17684 0 08407 14 00 0 000RECOMPENSA 0 40511 0 04223 9 59 0 000

s ϭ 0 2861 R- s q ϭ 98 3

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1256

tantes X 2 y X 3 se estima que 100 horas adicionales dedicadas a auditoriacuteas de campo descubri-raacuten $597000 adicionales de impuestos no pagados Observe que se redondearon los valoresproporcionados por la regresioacuten dada por Minitab (figura 13-2)

Suponga que en noviembre el IRS intenta dejar las horas de trabajo en auditoriacuteas de cam-po y las horas en computadora en sus niveles de octubre (4300 y 1500) pero decide aumen-tar las recompensas pagadas a los informantes a $75000 iquestCuaacutento de impuestos no pagadosesperan descubrir en noviembre Sustituyendo estos valores en la ecuacioacuten de regresioacuten esti-mada obtenemos

Y ˆ ϭ Ϫ45796 ϩ 0597 X 1 ϩ 1177 X 2 ϩ 0405 X 3

Y ˆ ϭ Ϫ45796 ϩ 0597(43) ϩ 1177(15) ϩ 0405(75)

Y ˆ ϭ Ϫ45796 ϩ 25671 ϩ 17655 ϩ 30375

Y ˆ ϭ 27905 larr Descubrimientos estimados $27905000

De modo que el departamento de auditoriacuteas espera descubrir aproximadamente $28 millonesde evasioacuten de impuestos en noviembre

2 Una medida de dispersioacuten el error estaacutendar de la estimacioacuten de la regresioacuten muacuteltiple Ya quehemos determinado la ecuacioacuten que relaciona a nuestras tres variables necesitamos una me-dida de la dispersioacuten alrededor de este plano de regresioacuten muacuteltiple En la regresioacuten simple laestimacioacuten es maacutes precisa conforme el grado de dispersioacuten alrededor de la regresioacuten es menorLo mismo es cierto para los puntos de la muestra que se encuentran alrededor del plano de re-gresioacuten muacuteltiple Para medir esta variacioacuten debemos utilizar de nuevo la medida conocida co-

mo error estaacutendar de la estimacioacuten

Medicioacuten de ladispersioacuten alrededordel plano de regre-sioacuten muacuteltiple usodel error estaacutendar dela estimacioacuten

Error estaacutendar de la estimacioacuten

se ϭ Ί [13-6]Y ndash Y ˆ )2ᎏᎏ

n Ϫ k Ϫ 1

donde

bull Y ϭ valores muestrales de la variable dependientebull Y ˆ ϭ valores correspondientes estimados con la ecuacioacuten de regresioacutenbull n ϭ nuacutemero de puntos de la muestrabull k ϭ nuacutemero de variables independientes (ϭ 3 en nuestro ejemplo)

El denominador de esta ecuacioacuten indica que en la regresioacuten muacuteltiple con k variables in-

dependientes el error estaacutendar tiene n Ϫ k Ϫ 1 grados de libertad Esto se debe a que los

grados de libertad se reducen de n en k ϩ 1 constantes numeacutericas a b1 b2 hellip b k que se

estimaron a partir de la misma muestra

Para calcular se observamos los errores individuales (Y Ϫ Y ˆ ) en el plano de regresioacuten ajus-tado los elevamos al cuadrado calculamos su media (dividiendo entre n Ϫ k Ϫ 1 en lugar den) y tomamos la raiacutez cuadrada del resultado Debido a la forma en que se calcula se se cono-ce a veces como raiacutez del error cuadraacutetico medio [o raiacutez de mse (mean-square error)] De lasalida de Minitab que usa s en lugar de se para denotar el error estaacutendar vemos que la raiacutez demse en el problema del Servicio Interno de Contribuciones es 0286 es decir $286000

Como en el caso de la regresioacuten simple podemos utilizar el error estaacutendar de la estimacioacuteny la distribucioacuten t para formar un intervalo de confianza alrededor de nuestro valor estimadoY ˆ En el problema de la evasioacuten de impuestospara 4300 horas de trabajo en auditoriacuteas de cam-po 1500 horas en computadora y $75000 de pago a informantes Y ˆ es $27905000 como es-timacioacuten de impuestos no pagados descubiertos y se es $286000 Si deseamos construir unintervalo de confianza del 95 alrededor de esta estimacioacuten de $27905000 miramos enla tabla 2 del apeacutendice en la columna del 5 y localizamos ahiacute el rengloacuten correspondiente a

Intervalos deconfianza para Y ˆ

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1356

n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad El valor apropiado de t para nuestracioacuten del intervalo es de 2447 En consecuencia podemos calcular los liacutemites de nutervalo de confianza como sigue

Y ˆ ϩ t (se) ϭ 27905000 ϩ (2447)(286000)

Y ˆ ϩ t(se) ϭ 27905000 ϩ 699800

Y ˆ ϩ t(se) ϭ 28604800 larr Liacutemite superior

Y ˆ Ϫ t (se) ϭ 27905000 Ϫ (2447)(286000)

Y ˆ ϩ t(se) ϭ 27905000 ndash 699800

Y ˆ ϩ t(se) ϭ 27205200 larr Liacutemite inferior

Con un nivel de confianza del 95 el departamento de auditoriacuteas puede sentirse sque los descubrimientos reales estaraacuten en este intervalo que va de $27205200 a $28Si el IRS desea usar un nivel de confianza menor como 90 puede reducir el intevalores para la estimacioacuten de descubrimientos de impuestos no pagados Igual que cgresioacuten simple podemos utilizar la distribucioacuten normal estaacutendar (tabla 1 del apeacutendaproximar la distribucioacuten t siempre que los grados de libertad (n menos el nuacutemero cientes de regresioacuten estimados) sea un nuacutemero mayor que 30

Al antildeadir la tercera variable independiente (recompensas a informantes) iquestmejoroacuteregresioacuten Como se mide la dispersioacuten de los datos alrededor del plano de regresioacutenmenores de se deberiacutean indicar mejores regresiones Para la regresioacuten de dos variablecimos con anterioridad en este mismo capiacutetulo se resultoacute ser 1076 Como al agregarra variable se se redujo a 0286 vemos que siacute mejoroacute el ajuste de la regresioacuten en este Sin embargo en general no es cierto que al agregar variables siempre se reduzc

3 El coeficiente de determinacioacuten muacuteltiple Al estudiar el anaacutelisis de correlacioacuten simpmos la fuerza de la relacioacuten entre dos variables utilizando el coeficiente de determinla muestra r 2 Este coeficiente de determinacioacuten es la fraccioacuten de la variacioacuten total riable dependiente Y que se explica con la ecuacioacuten de estimacioacuten

Similarmente en la correlacioacuten muacuteltiple mediremos la fuerza de la relacioacuten entre trbles utilizando el coeficiente de determinacioacuten muacuteltiple R

2 o su raiacutez cuadrada R (el cte de correlacioacuten muacuteltiple) Este coeficiente de determinacioacuten muacuteltiple es tambieacuten la

que representa la porcioacuten de la variacioacuten total de Y que ldquoexplicardquo el plano de regr

Note que la salida del programa da el valor 983 para R2 Esto nos dice que las tr

bles independientes explican el 983 de la variacioacuten total de impuestos no pagadobiertos Para la regresioacuten de dos variables hecha antes R2 es soacutelo 0729 asiacute que las trabajo en auditoriacutea de campo y las horas en computadora explican el 729 de la vaagregar las recompensas a los informantes explica el 254 restante de la variacioacuten

Todaviacutea no hemos explicado los nuacutemeros en las columnas etiquetadas con Desvciente t y p de la figura 13-2 Estos nuacutemeros se utilizaraacuten para hacer inferencias acercano de regresioacuten de la poblacioacuten tema que se trataraacute en la seccioacuten 13-4

Uso del coeficientede determinacioacutenmuacuteltiple

Valor de variablesadicionales

Interpretacioacuten delintervalo deconfianza

Ya nadie calcula regresiones a mano hayotras cosas maacutes interesantes en queacute ocu-par nuestro tiempo Se explicoacute la teacutecnicacalculando las soluciones a mano para

que no tenga que pensar en su computadora como en unaldquocaja negrardquo que hace muchas cosas uacutetiles que no puedeexplicar Sugerencia el valor real de usar la computadorapara calcular regresiones muacuteltiples es que puede manejarmuchas variables independientes y obtener una mejor ecua-

cioacuten de estimacioacuten que puede medir si agregar otrble independiente realmente mejora los resultados yposible observar con rapidez el comportamiento de

indica la proporcioacuten de la variacioacuten total de la variapendiente que se explica con las variables indepenLa computadora hace todo el trabajo tedioso mdashsin semdash y le deja tiempo para el trabajo maacutes importcomprender los resultados y usarlos para tomar mdecisiones

SUGERENCIASY

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1456

La ec uac i oacuten de r egr es i oacuten esY = - 12 75 + 17 1 X1 + 0 54 1 X2 - 0 17 4 X3

Pr onos t i c ador Coe f De s vEs t Coc i e nt e - t pCons t a n t e - 1275 2699 - 0 47 0 719X1 17 059 6 908 2 47 0 245X2 0 5406 0 3144 1 72 0 335X3 - 0 1743 0 1005 - 1 73 0 333

s = 396 1 R- s q = 87 2

b) iquestQueacute porcentaje de la variacioacuten total del nuacutemero de solicitudes urgentes de devolucioacuten de impuestosexplica esta ecuacioacuten

c) Para este antildeo el iacutendice econoacutemico es 169 la poblacioacuten residente en un radio de una milla desde la

oficina es 10212 habitantes y el ingreso promedio en Ithaca es $26925 iquestCuaacutentas solicitudes urgen-tes de devolucioacuten de impuestos debe Pam esperar procesar entre el 1 de marzo y el 15 de abril

Conceptos baacutesicos 13-14 Dado el siguiente conjunto de datos utilice el paquete de software que tenga disponible para encontrar la

ecuacioacuten de regresioacuten de mejor ajuste y responda a lo siguientea) iquestCuaacutel es la ecuacioacuten de regresioacutenb) iquestCuaacutel es el error estaacutendar de la estimacioacutenc) iquestCuaacutel es el valor de R

2 para esta regresioacutend) iquestCuaacutel es el valor pronosticado para Y cuando X 1 ϭ 58 X 2 ϭ 42 y X 3 ϭ 51

Y X 1 X 2 X 3

647 35 53 85809 74 16 26246 25 63 45439 37 94 88777 55 14 36206 83 92 25669 67 25 27343 12 22 13

Ejercicios 133

Ejercicios de autoevaluacioacuten

EA 13-3 Pam Schneider posee y opera un despacho de contadores en Ithaca Nueva York Ella piensa que seriacutea uacutetilpredecir el nuacutemero de solicitudes urgentes de devolucioacuten de impuestos que le pediraacuten durante el ajetrea-do periodo del 1 de marzo al 15 de abril para poder planear mejor sus necesidades de personal duranteesta eacutepoca Tiene la hipoacutetesis de que varios factores pueden ser uacutetiles para su pronoacutestico Los datos de es-tos factores y el nuacutemero de solicitudes urgentes de devolucioacuten de impuestos de antildeos pasados son

Y X 2 Nuacutemero de

Poblacioacuten solicitudesresidente X 3 de devolucioacuten

X 1 en un radio Ingreso urgentesIacutendice de una milla promedio (1 de marzo

econoacutemico desde la oficina en Ithaca a 15 de abril)

99 10188 21465 2306106 8566 22228 1266100 10557 27665 1422129 10219 25200 1721179 9662 26300 2544

a) Use el siguiente resultado de Minitab para determinar la ecuacioacuten de regresioacuten maacutes adecuada para es-

tos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1556

13-15 Dado el siguiente conjunto de datos utilice el paquete de software que tenga a su disposicioacuten patrar la ecuacioacuten de regresioacuten de mejor ajuste y responda a lo siguientea) iquestCuaacutel es la ecuacioacuten de regresioacutenb) iquestCuaacutel es el error estaacutendar de la estimacioacutenc) iquestCuaacutel es el valor de R2 para esta regresioacutend) Deacute un intervalo de confianza para la estimacioacuten del 95 para el valor Y cuando los valores X

y X 4 son 524 416 358 y 3 respectivamente

X 1 X 2 X 3 X 4 Y

214 629 219 Ϫ2 228

517 407 429 5 937418 818 698 2 649

118 410 909 Ϫ4 192

716 226 129 8 558

919 615 309 1 231

Aplicaciones

1316 Las estaciones de policiacutea en Estados Unidos estaacuten interesadas en predecir el nuacutemero de arrestodos que deberaacuten procesar cada mes para programar mejor a los empleados de oficina En los daricos el nuacutemero promedio de arrestos (Y ) cada mes tiene influencia del nuacutemero de oficiales en

policiaca ( X 1) la poblacioacuten de la ciudad en miles ( X 2) y el porcentaje de personas desempleadasdad en miles ( X 3) Los datos de estos factores en 15 ciudades se presentan en la tablaa) Utilice el paquete de software que tenga disponible para determinar la ecuacioacuten de regresioacuten

jor se ajuste a estos datosb) iquestQueacute porcentaje de la variacioacuten total en el nuacutemero de arrestos (Y ) explica esta ecuacioacutenc) El departamento de policiacutea de ChapelBoro desea pronosticar el nuacutemero de arrestos mensua

pelBoro tiene una poblacioacuten de 75000 habitantes 82 elementos en su fuerza policiaca y utaje de desempleo del 105 iquestCuaacutentos arrestos pronostica para cada mes

Nuacutemero promedio Nuacutemero de oficiales Tamantildeo de la ciudad (X 2) Porcende arrestos mensuales (Y ) en la fuerza (X 1) en miles de habitantes desemp

3906 68 816 4

5043 94 751 3

6284 125 973 5

7456 175 1235 8

5852 113 1184 11

4503 82 654 9

3278 46 616 12

2605 32 543 18

4775 89 974 4

3898 67 824 6

3124 47 564 8

3675 59 713 7

3744 61 674 9

4946 87 963 11

4875 92 864 4

13-17 Estamos intentando predecir la demanda anual (DEMAND) de cierto producto utilizando las svariables independientes

PRECIO ϭ precio del producto (en doacutelares)

INGRESO ϭ ingreso del consumidor (en doacutelares)

SUB ϭ precio de un bien sustituto (en doacutelares)

( Nota Un bien sustituto es aquel que puede suplir a otro bien Por ejemplo la margarina es untituto de la mantequilla)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1656

Se recolectaron datos correspondientes al periodo 1982-1996

Antildeo Demanda Precio ($) Ingreso ($) Sub ($)

1982 40 9 400 101983 45 8 500 141984 50 9 600 121985 55 8 700 131986 60 7 800 111987 70 6 900 151988 65 6 1000 161989 65 8 1100 17

1990 75 5 1200 221991 75 5 1300 191992 80 5 1400 201993 100 3 1500 231994 90 4 1600 181995 95 3 1700 241996 85 4 1800 21

a) Utilice el paquete de software que tenga disponible para encontrar la ecuacioacuten de regresioacuten ajuste para estos datos

b) iquestSon los signos (ϩ o Ϫ) de los coeficientes de regresioacuten de las variables independientes los qperan Deacute una explicacioacuten breve ( Nota Eacutesta no es una pregunta estadiacutestica soacutelo necesita pesignifican los coeficientes de regresioacuten)

c) Establezca e interprete el coeficiente de determinacioacuten muacuteltiple del problemad) Establezca e interprete el error estaacutendar de la estimacioacuten para el problemae) Seguacuten la ecuacioacuten de regresioacuten obtenida iquestqueacute valor de DEMAND predeciriacutea si el precio de

ductos fue $6 el ingreso del consumidor $1200 y el precio del bien sustituto $17 13-18 Bill Buxton profesor de estadiacutestica de una prominente escuela de administracioacuten tiene un prof

tereacutes en los factores que afectan el desempentildeo de los estudiantes en los exaacutemenes El examen psemestre anterior tuvo una distribucioacuten de calificaciones amplia pero Bill tiene la certeza de qfactores explican esa distribucioacuten permite a sus estudiantes que estudien en tantos libros comoca el coeficiente de inteligencia de los estudiantes variacutea tienen distintas edades y difieren losque dedican a estudiar Con el propoacutesito de desarrollar una foacutermula de prediccioacuten para las califde los exaacutemenes Bill pidioacute a cada estudiante que respondiera al final del examen preguntas refe

tiempo de estudio y nuacutemero de libros utilizados Los registros que teniacutea Bill ya incluiacutean el coefiinteligencia y la edad de modo que reunioacute los datos del grupo y corrioacute la regresioacuten muacuteltiple deLa salida de la corrida de Bill fue la siguiente

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t Con s t a nt e minus49 948 41 55 minus1 20 0HORAS 1 06931 0 98163 1 09 0CI 1 36460 0 37627 3 63 0LI BROS 2 03982 1 50799 1 35 0EDAD minus1 79890 0 67332 minus2 67 0

s = 11 657 R- s q = 76 7

a) iquestCuaacutel es la ecuacioacuten de regresioacuten de mejor ajuste para estos datos

b) iquestQueacute porcentaje de la variacioacuten en las calificaciones se explica con esta ecuacioacutenc) iquestQueacute calificacioacuten esperariacutea usted para un estudiante de 21 antildeos de edad con un coeficiente gencia (CI) de 113 que estudioacute durante cinco horas y utilizoacute tres libros diferentes

13-19 La compantildeiacutea de tiendas de abarrotes Twenty-Two estaacute planeando expandir su cadena Como ayudleccionar los lugares donde abriraacute las nuevas tiendas recolectoacute datos de las ventas semanales de casus 23 tiendas Para explicar la variabilidad de las ventas semanales tambieacuten reunioacute informacioacutencribe cuatro variables que se cree estaacuten relacionadas con las ventas Las variables se definen como

VENTAS ϭ ventas semanales promedio en cada tienda en miles de doacutelares

AUTOS ϭ volumen promedio de traacutensito de automoacuteviles por semana en miles de autos

ENTRADA ϭ facilidad de entradasalida medida en una escala de 1 a 100

INGANUAL ϭ ingreso anual promedio por familia en el aacuterea en miles de doacutelares

DISTANCIA ϭ distancia en millas desde la tienda al supermercado maacutes cercano

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1756

Los datos se analizaron con Minitab y la salida es la siguiente

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t Cons t a nt e 175 37 92 62 1 89 0 0AUTOS - 0 028 0 315 minus0 09 0 9ENTRADA 3 775 1 272 2 97 0 0I NGANUAL 1 990 4 510 0 44 0 6DI STANCI A 212 41 28 090 7 56 0 0

s = 85 587 R- s q = 95 8

a) iquestCuaacutel es la ecuacioacuten de regresioacuten de mejor ajuste dada por Minitab

b) iquestCuaacutel es el error estaacutendar de la estimacioacuten para esta ecuacioacutenc) iquestQueacute fraccioacuten de la variacioacuten en las ventas se explica con esta regresioacutend) iquestQueacute ventas predeciriacutea para una tienda localizada en un vecindario que tuvo un ingreso anu

milia de $20000 estaba a 2 millas del supermercado maacutes cercano se encontraba en una calvolumen promedio semanal de traacutensito de 100000 autos y con una facilidad de entrada de

13-20 Rick Blackburn estaacute pensando en vender su casa Con el fin de decidir el precio que pediraacute poreunido datos de 12 ventas recientes Registroacute el precio de venta (en miles de doacutelares) el nuacutemercuadrados de construccioacuten (en cientos de pies cuadrados) el nuacutemero de pisos el nuacutemero de bantiguumledad de la casa (en antildeos)

Precio de venta Pies cuad Pisos Bantildeos Antiguumledad

4965 89 1 10 2

6795 95 1 10 68115 126 2 15 11

8160 129 2 15 8

9150 190 2 10 22

9525 176 1 10 17

10035 200 2 15 12

10425 206 2 15 11

11265 205 1 20 9

14970 251 2 20 8

16065 227 2 20 18

23250 408 3 40 12

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de

de mejor ajuste para los datosb) iquestCuaacutel es el valor de R2 para esta ecuacioacutenc) Si la casa de Rick tiene 1800 pies cuadrados (ϭ 180 cientos de pies cuadrados) un piso

y seis antildeos de antiguumledad iquestqueacute precio de venta puede esperar Rick 13-21 La Allegheny Steel Corporation ha estado buscando los factores que influyen en la cantidad de

millones de toneladas) que puede vender cada antildeo La administracioacuten sospecha que los siguientfactores principales la tasa anual de inflacioacuten del paiacutes el precio promedio por tonelada del acetado que acota los precios (en doacutelares) de Allegheny y el nuacutemero de automoacuteviles (en millonesfabricantes de autos de Estados Unidos planean producir ese antildeo Se recolectaron los datos de losiete antildeos

Y X 2 X 3

Millones X 1 Cota de Nuacutemero

de tons Tasa de importa- deAntildeo vendidas inflacioacuten ciones automoacuteviles

1993 42 31 310 62

1992 31 39 500 51

1991 40 75 220 57

1990 47 107 450 71

1989 43 155 435 65

1988 37 130 260 61

1987 35 110 305 59

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1856

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de regresioacutende mejor ajuste para los datos

b) iquestQueacute porcentaje de la variacioacuten total de la cantidad de acero vendido (en millones de toneladas) porAllegheny cada antildeo explica esta ecuacioacuten

c) iquestCuaacutentas toneladas de acero deberaacute esperar Allegheny vender en un antildeo en el que la tasa de inflacioacutenes 71 los fabricantes de automoacuteviles norteamericanos planean producir 60 millones de autos y la co-ta promedio del acero importado por tonelada es $350

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-3 De la salida del paquete de software se obtienen los siguientes resultadosa) Y ˆ ϭ Ϫ1275 ϩ 17059 X 1 ϩ 05406 X 2 Ϫ 01743 X 3b) R

2ϭ 872 el modelo explica el 872 de la variacioacuten total en Y

c) Y ˆ ϭ Ϫ1275 ϩ 17059(169) ϩ 05406(10212) Ϫ 01743(26925) ϭ 2436 reembolsos de impuestos

134 Inferencias sobre paraacutemetrosde poblacioacuten

En el capiacutetulo 12 se vio que la recta de regresioacuten de la muestra Y ˆ ϭ a ϩ bX (ecuacioacuten 12-3) esti-maba la recta de regresioacuten de la poblacioacuten Y ϭ A ϩ BX (ecuacioacuten 12-13) La razoacuten por la cual soacute-lo podiacuteamos estimar la recta de regresioacuten de poblacioacuten y no determinarla con exactitud era que los

puntos no caen exactamente en la recta de regresioacuten de la poblacioacuten Debido a las variaciones alea-torias los puntos satisfaciacutean Y ϭ A ϩ BX ϩ e (ecuacioacuten 12-13a) maacutes que a Y ϭ A ϩ BX

En la regresioacuten muacuteltiple se tiene justo la misma situacioacuten Nuestro plano de regresioacuten estimado

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k [13-5]

es una estimacioacuten de un plano de regresioacuten de poblacioacuten verdadero pero desconocido de la forma

Plano de regresioacutende la poblacioacuten

De nuevo los puntos individuales normalmente no caen con exactitud en el plano de regresioacuten depoblacioacuten Consideremos el problema del Servicio Interno de Contribuciones para ver por queacute Notodos los pagos a informantes tendraacuten la misma efectividad Algunas horas en computadora podriacuteanutilizarse para recolectar y organizar datos otras para analizar esos datos en busca de errores y frau-des El eacutexito de la computadora en descubrir impuestos no pagados puede depender de cuaacutento tiempose dedique a cada una de estas actividades Por eacutestas y otras razones algunos de los puntos se en-contraraacuten arriba del plano de regresioacuten y algunos estaraacuten abajo de eacuteste En lugar de satisfacer laecuacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

los puntos individuales satisfaraacuten la ecuacioacuten

Las variaciones alea-torias desplazan lospuntos del plano deregresioacuten

Ecuacioacuten de regresioacuten de la poblacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

Plano de regresioacuten de la poblacioacuten maacutes la variacioacuten aleatoria

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e [13-7a]

La cantidad e que aparece en la ecuacioacuten 13-7a es una variacioacuten aleatoria que en promedio es iguala cero La desviacioacuten estaacutendar de las variaciones individuales e y el error estaacutendar de la estima-cioacuten se que estudiamos en la seccioacuten anterior es una estimacioacuten de e

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1956

Como nuestro plano de regresioacuten de la muestra Y ˆ ϭ a ϩ b1X1 ϩ b2 X 2 ϩ ϩ bk X k (ecuaci13-7) estima el plano de regresioacuten de poblacioacuten desconocido Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk

(ecuacioacuten 13-7) deberemos ser capaces de usarlo para hacer inferencias sobre el plano de regreside la poblacioacuten En esta seccioacuten haremos inferencias acerca de las pendientes ( B1 B2 Bk ) deecuacioacuten de regresioacuten ldquoverdaderardquo (la que se aplica a la poblacioacuten completa) basadas en las pendietes (b1 b2 bk ) de la ecuacioacuten de regresioacuten estimada a partir de la muestra de datos

Inferencias acerca de una pendiente individual B i El plano de regresioacuten se deriva de una muestra y no de la poblacioacuten completa Como resultado

podemos esperar que la ecuacioacuten de regresioacuten verdadera Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k que se aplica a la poblacioacuten completa) sea exactamente igual que la ecuacioacuten estimada a partir observaciones de la muestra Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k Sin embargo podemos utilizarvalor de bi una de las pendientes que calculamos a partir de la muestra para probar hipoacutetesis acca del valor de Bi una de las pendientes del plano de regresioacuten para la poblacioacuten completa

El procedimiento para probar una hipoacutetesis respecto a Bi es parecido al procedimiento analizaen los capiacutetulos 8 y 9 sobre pruebas de hipoacutetesis Para entender este proceso regresemos al probma que relaciona los impuestos no pagados descubiertos con las horas de trabajo en auditoriacuteas campo horas en computadora y recompensas a informantes En la paacutegina 729 sentildealamos que b10597 El primer paso consiste en encontrar un valor para B1 y compararlo con b1 ϭ 0597

Suponga que durante un periodo largo la pendiente de la relacioacuten entre Y y X 1 fue 0400 Paprobar si todaviacutea es vaacutelida podriacuteamos definir las hipoacutetesis como

H0 B1 ϭ 0400 larr Hipoacutetesis nula

H1 B1 0400 larr Hipoacutetesis alternativa

De hecho realizamos la prueba para saber si los datos actuales indican que B1 ha cambiado su vahistoacuterico de 0400

Para encontrar el estadiacutestico de prueba para B1 es necesario hallar primero el error estaacutendar d

coeficiente de regresioacuten El coeficiente de regresioacuten con el que estamos trabajando es b1 de moque el error estaacutendar de este coeficiente se representa con sb1

Resulta demasiado difiacutecil calcular sb1 a mano pero por fortuna Minitab calcula los errores estaacutedar de todos los coeficientes de regresioacuten Por comodidad repetimos la figura 13-2 Los errores taacutendar de los coeficientes se dan en la columna DesvEst de la salida de Minitab

En el cuadro de salida vemos que sb1

es 00811 (Similarmente si deseamos probar una hipoacutesis acerca de B2 vemos que el error estaacutendar apropiado que debemos utilizar es sb2 ϭ 00841) Uvez que encontramos sb1 en la salida de Minitab podemos usar la ecuacioacuten 13-8 para estandarizarpendiente de nuestra ecuacioacuten de regresioacuten ajustada

Estandarizacioacutendel coeficiente deregresioacuten

Error estaacutendar delcoeficientede regresioacuten

Prueba de unahipoacutetesis acerca de B i

Diferencia entre la

ecuacioacuten de regre-sioacuten verdadera y unaestimada a partir delas observacionesde la muestra

Coeficiente de regresioacuten estandarizado

t ϭ [13-8bi ndash Bi0ᎏ

sbi

donde

bull biϭ pendiente de la regresioacuten ajustada

bull Bi0 ϭ pendiente real hipoteacutetica para la poblacioacutenbull sbi ϭ error estaacutendar del coeficiente de regresioacuten

iquestPor queacute utilizamos t para denotar el estadiacutestico estandarizado Recuerde que en la regresioacuten siple utilizamos a y b en la ecuacioacuten 12-7 para calcular se y que se estimaba e la desviacioacuten estaacutedar de las variaciones de los datos (ecuacioacuten 12-13a) Entonces utilizamos se en la ecuacioacuten 12-para encontrar sb el error estaacutendar del coeficiente de regresioacuten que corresponde a la pendiente E

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2056

pezamos con n puntos y los usamos para estimar los dos coeficientes a y b Luego basamtras pruebas en la distribucioacuten t con n Ϫ 2 grados de libertad

De manera similar en la regresioacuten muacuteltiple tambieacuten empezamos con n puntos pero lospara estimar k ϩ 1 coeficientes la ordenada a y k pendientes b1 b2 bk Despueacutes estcientes se usan en la ecuacioacuten 13-6 para calcular se que de nuevo es una estimacioacuten de eviacioacuten estaacutendar de las variaciones de los datos (ecuacioacuten 13-7a) Luego se utiliza se (en ucioacuten que estaacute maacutes allaacute del alcance de este libro) para encontrar s

bi Debido a lo anterior

nuestras pruebas de hipoacutetesis en la distribucioacuten t con n Ϫ k Ϫ 1 (ϭ n Ϫ ( k ϩ l)) grados de En nuestro ejemplo el valor estandarizado del coeficiente de regresioacuten es

t ϭ

ϭ

ϭ 2432 larr Coeficiente de regresioacuten estandarizado

Suponga que estamos interesados en probar nuestras hipoacutetesis al nivel de significancia

Como tenemos 10 observaciones en la muestra y tres variables independientes sabemos n Ϫ k Ϫ 1 o 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad Buscamos en la tabla 2 del apeacutendice en lana de 10 y el rengloacuten de 6 grados de libertad Ahiacute vemos que el valor apropiado de t es 19mo nos preocupa si b1 (la pendiente del plano de regresioacuten de la muestra) es significativamferente de B1 (la pendiente hipoteacutetica del plano de regresioacuten de la poblacioacuten) eacutesta es una pdos colas y los valores criacuteticos son Ϯ1943 El coeficiente de regresioacuten estandarizado es 2se encuentra fuera de la regioacuten de aceptacioacuten de nuestra prueba de hipoacutetesis Por consiguichazamos la hipoacutetesis nula de que B1 todaviacutea es igual a 0400 En otras palabras existe unacia suficientemente grande entre b1 y 0400 para concluir que B1 ha cambiado respecto a histoacuterico Por esto sentimos que cada 100 horas adicionales de trabajo en auditoriacuteas de camaumentan la cantidad de descubrimientos de impuestos no pagados en $400000 como lo hel pasado

Ademaacutes de la prueba de hipoacutetesis podemos construir un intervalo de confianza para cude los valores de Bi Del mismo modo que bi es una estimacioacuten puntual de Bi estos intervalofianza son estimaciones de intervalo de Bi Para ilustrar el proceso de construccioacuten de interconfianza encontremos un intervalo de confianza del 95 para B3 en el ejemplo del IRS Lrelevantes son

b3 ϭ 0405 de la figura 13-2sb3 ϭ 00422

t ϭ 2447 larr Nivel de significancia del 5 y 6 grados de libertad

Intervalo deconfianza para B i

Realizacioacuten de la

prueba de hipoacutetesis

0597 ndash 0400ᎏᎏ

0081

b1 ndash B10ᎏ

sb1

Anaacute l i s i s de r e gr e s i oacutenLa ec uaci oacuten de r egr es i oacuten esDESCUBRE = - 45 0 + 0 597 AUDI TORIacute A + 1 18 COMPUTADORA + 0 405 RECOMPENSA

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 45 796 4 878 - 9 39 0 000AUDI TORIacute A 0 50697 0 08112 7 36 0 000COMPUTADORA 1 17684 0 08407 14 00 0 000RECOMPENSAS 0 40511 0 04223 9 59 0 000

s = 0 2861 R- s q = 98 3

FIGURA 13-2

Salida de Minitab(figura repetida)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2156

Con esta informacioacuten podemos calcular el intervalo de confianza de la siguiente manera

b3 ϩ t (sb3) ϭ 0405 ϩ 2447(00422)

ϭ 0508 larr Liacutemite superior

b3 Ϫ t (sb3) ϭ 0405 Ϫ 2447(00422)

ϭ 0302 larr Liacutemite inferior

Vemos que podemos tener una seguridad del 95 de que cada $1000 adicionales pagados a los formantes aumenta el descubrimiento de impuestos no pagados en una cantidad entre $302000$508000

A menudo estaremos interesados en preguntas del tipo iquesten realidad Y depende de X i Por ejeplo podriacuteamos preguntar si descubrir impuestos no pagados en realidad depende de las horas encomputadora Con frecuencia esta pregunta se plantea como iquestes X i una variable explicativa sigficativa de Y Si piensa un poco maacutes se convenceraacute de que si Bi 0 Y depende de las X i (esto esvariacutea cuando X i variacutea) y no depende de X i si Bi ϭ 0

Vemos que nuestra pregunta conduce a establecer hipoacutetesis de la forma

H0 Bi ϭ 0 larr Hipoacutetesis nula X i no es una variable explicativa significativa

H1 Bi 0 larr Hipoacutetesis alternativa X i es una variable explicativa significativa

Podemos probar estas hipoacutetesis utilizando la ecuacioacuten 13-8 del mismo modo que cuando probamnuestras hipoacutetesis acerca de si B1 todaviacutea era igual a 0400 Sin embargo existe una forma maacutes faacutede hacerlo usando la columna de la figura 13-2 de ldquocociente- t rdquo Observemos de nuevo la ecuaci13-8

t ϭ [13-

Como nuestro valor hipoteacutetico de Bi es cero el valor estandarizado del coeficiente de regresioacutedenotado por t o se convierte en

t o ϭ

El valor de t o se conoce como valor t ldquocalculadordquo Eacuteste es el nuacutemero que aparece en la columna equetada como ldquocociente-t rdquo en la figura 13-2 Denotemos por t c el valor t ldquocriacuteticordquo que buscamos

la tabla 2 del apeacutendice Entonces como la prueba para determinar si X i es una variable explicatisignificativa es una prueba de dos colas soacutelo necesitamos verificar si Ϫt c Յ t o Յ t c

Uso de valores t

calculados en lasalida de Minitab

biᎏ

sbi

bi ndash Bi0ᎏ

sbi

iquestEs significativa unavariable explicativa

Prueba para determinar si una variable es o no significativa

Ϫt c Յ t o Յ t c [13-9

donde

bull t c ϭ valor t adecuado (con n Ϫ k Ϫ 1 grados de libertad) para el nivel de significancia deprueba

bull t o ϭ bi sbi ϭ valor t observado (o calculado) obtenido con el paquete de software

Si t o

cae entre Ϫt c

y t c aceptamos H0 y llegamos a la conclusioacuten de que X

ino es una variable exp

cativa significativa En cualquier otro caso rechazamos H0 y concluimos que X i es una variable eplicativa significativa

Probemos al nivel de significancia de 001 si las horas en computadora constituyen una variabexplicativa significativa para los impuestos no pagados descubiertos De la tabla 2 del apeacutendice cn Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad y ϭ 001 vemos que t c ϭ 3707 De la figura 13tenemos que t o = 1400 Como t o Ͼ t c concluimos que el tiempo en computadora es una variab

Prueba de lasignificancia de lavariable horas decomputadora en elproblema del IRS

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2256

explicativa significativa De hecho al observar los valores t calculados para las otras dos vindependientes (tiempo de auditoriacuteas de campo t o ϭ 736 y recompensa a informantes t ovemos que tambieacuten son variables explicativas significativas

Podemos tambieacuten utilizar la columna de ldquoprdquo para probar si X i es una variable explicativacativa De hecho utilizando esa informacioacuten ni siquiera necesitamos usar la tabla 2 del aLos elementos de esta columna son los valores prob para las hipoacutetesis

H0 Biϭ 0

H1 Bi 0

Recuerde del anaacutelisis hecho en el capiacutetulo 9 que estos valores prob constituyen la probabque cada bi esteacute tan lejos de cero como (o maacutes) el valor observado obtenido de la regresioacutenverdadera Como se ilustra en la figura 13-3 solamente necesitamos comparar estos valocon el nivel de significancia de la prueba para determinar si X i es o no una variable expsignificativa para Y

Probar la significancia de una variable explicativa es siempre una prueba de dos colas Lble independiente X i es una variable explicativa significativa si bi es significativamente dife

cero es decir si t o es un nuacutemero grande positivo o negativoPara el ejemplo del IRS repetimos las pruebas con ϭ 001 Para cada una de las tres v

independientes p es menor que 001 de forma que podemos concluir que cada una de ellanificativa

Inferencias acerca de la regresioacuten como un todo

(usando una prueba F )

Suponga que cubre con papel un tablero para dardos y lanza varios dardos sobre eacutel Despueacuteberlo hecho tendraacute algo muy parecido a un diagrama de dispersioacuten Suponga entonces quuna recta de regresioacuten a este conjunto de ldquopuntos observadosrdquo y calcula r

2 Debido a que lofueron lanzados aleatoriamente usted espera obtener un valor bajo de r

2 puesto que en esten realidad no explica a Y Sin embargo si hace esto muchas veces ocasionalmente observalor alto de r

2 por pura casualidadDada cualquier regresioacuten simple (o muacuteltiple) es natural preguntarse si el valor de r2 (

realmente indica que las variables independientes explican a Y o si esto sucede por cas

A menudo esta interrogante se plantea de la siguiente manera iquestla regresioacuten como un todo ficativa En la uacuteltima seccioacuten vimos coacutemo decidir si una X i individual es una variable exp

Significancia de laregresioacuten comoun todo

FIGURA 13-3

Uso de ldquoprdquo paradeterminar si X i esuna variable expli-cativa significativa

Regioacuten de aceptacioacuten Regioacuten de aceptacioacuten

2 del aacuterea

2 del aacuterea

2 del aacuterea

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

ndasht c

ndasht o

t o

t c

0

(a) p es mayor que X

i no es una variable

explicativa significativa

(b) p es menor que X

i es una variable

explicativa significativa

ndasht o

ndasht c

t c

0

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2356

significativa ahora veremos coacutemo decidir si todas las X i tomadas en conjunto explican significavamente la variabilidad observada de Y Nuestras hipoacutetesis son

H0 B1 ϭ B2 ϭ ϭ Bk ϭ 0 larr Hipoacutetesis nula Y no depende de las X i

H1 por lo menos una Bi 0 larr Hipoacutetesis alternativa Y depende de al menos una de las X i

Cuando analizamos r 2 en el capiacutetulo 12 consideramos la variacioacuten total en Y sum(Y Ϫ Y ෆ )2 la p

te de dicha variacioacuten que explica la regresioacuten sum(Y ˆ Ϫ Y ෆ )2 y la parte no explicada de la variacioacutensum(Y Ϫ Y ˆ )2 La figura 13-4 es un duplicado de la figura 12-15 Sirve como repaso de la relacioacuten etre la desviacioacuten total la desviacioacuten explicada y la desviacioacuten no explicada para un solo dato en uregresioacuten simple Aunque no podamos dibujar una figura similar para una regresioacuten muacuteltiple coceptualmente estamos haciendo lo mismo

Al analizar la variacioacuten en Y fijamos nuestra atencioacuten en tres teacuterminos diferentes cada uno de cuales es una suma de cuadrados Los denotamos con

Suma de cuadradosy sus grados delibertad

Anaacutelisis de lavariacioacuten de losvalores Y

FIGURA 13-4

Desviacioacuten totaldesviacioacutenexplicada ydesviacioacuten noexplicada paraun valor observadode Y

Y

X

Un valor observado de lavariable dependiente (Y )

R e c t a d

e r e g r e s

i oacute n

Desviacioacuten no explicada de esta Y respectoa su media Y

(Y ndash Y )^

Desviacioacuten explicada deesta Y respecto a su media Y

(Y ndash Y )^Y

Valor estimado de esta Y

a partir de la recta de regresioacuten (Y )^

Desviacioacuten total de esta Y

respecto a su media Y

(Y ndash Y )

Tres sumas de cuadrados

SCT ϭ suma de cuadrados total (es decir la parte explicada) ϭ sum(Y Ϫ Y ෆ )2

SCR ϭ suma de cuadrados de la regresioacuten (es decir la parte explicada) ϭ sum(Y ˆ Ϫ Y ෆ )2 [13-10

SCE ϭ suma de cuadrados del error (es decir la parte no explicada) ϭ sum(Y Ϫ Y ˆ )2

Estaacuten relacionadas por la ecuacioacuten

que dice que la variacioacuten total en Y puede dividirse en dos partes la parte explicada y la no explicaCada una de estas sumas de cuadrados tiene un nuacutemero asociado de grados de libertad SCT t

ne n Ϫ 1 grados de libertad (n observaciones menos un grado de libertad debido a que la media la muestra estaacute fija) SCR tiene k grados de libertad porque existen k variables independientes qse utilizaron para explicar Y Finalmente SCE tiene n Ϫ k Ϫ 1 grados de libertad porque utilizamnuestras n observaciones para estimar k ϩ 1 constantes a b1 b2 bk Si la hipoacutetesis nula es ci

ta el cociente

Descomposicioacuten de la variacioacuten total de Y

SCT ϭ SCR ϩ SCE [13-1

Cociente F

F ϭ [13-12SCR k ᎏᎏ

SCE(n ndash k ndash 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2456

tiene una distribucioacuten F con k grados de libertad en el numerador y n Ϫ k Ϫ 1 grados de libel denominador Si la hipoacutetesis nula es falsa entonces el cociente tiende a ser maacutes grande qula hipoacutetesis nula es verdadera De modo que si el cociente F es demasiado grande (seguacuten lo na el nivel de significancia de la prueba y el valor apropiado de la tabla 6 del apeacutendice) rechH0 y concluimos que la regresioacuten como un todo es significativa

La figura 13-5 presenta la salida de Minitab para el problema del IRS Esta parte del rincluye los cocientes F calculados para la regresioacuten en ocasiones llamado anaacutelisis de v

(ANOVA) para la regresioacuten Probablemente se pregunte si esto tiene algo que ver con el anaacutelisrianza que estudiamos en el capiacutetulo 11 La respuesta es siacute Aunque no lo hicimos es posibletrar que el anaacutelisis de varianza visto en el capiacutetulo 11 tambieacuten contempla la variacioacuten total las observaciones alrededor de la gran media y la divide en dos partes una explicada por lascias entre los distintos grupos (que corresponde a lo que llamamos varianza entre columnas)

no explicada por dichas diferencias (que corresponde a la varianza dentro de columnas) Estcisamente anaacutelogo a lo que acabamos de hacer en la ecuacioacuten 13-11Para el problema del IRS vemos que SCR ϭ 29109 (con k ϭ 3 grados de libertad) SCE

(con n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad) y que

F ϭ ϭ ϭ 11833

Los elementos en la columna ldquoMCrdquo son justo las sumas de cuadrados divididas entre sus glibertad Para 3 grados de libertad en el numerador y 6 en el denominador la tabla 6 del apeacutence que 978 es el liacutemite superior de la regioacuten de aceptacioacuten para un nivel de significancia El valor calculado de F 11833 estaacute muy por arriba de 978 de manera que se ve que la r

como un todo es altamente significativa Se puede llegar a la misma conclusioacuten si se observresultado del programa dice que ldquo prdquo es 0000 Debido a que este valor prob es menor que elsignificancia ϭ 001 se concluye que la regresioacuten completa es significativa De esta mapuede usar la p de ANOVA como prueba sin tener que utilizar la tabla 6 del apeacutendice para bvalor criacutetico de F Esto es anaacutelogo a la manera en que se usaron los valores de p en la figura ra probar la significancia de las variables explicativas individuales

Multicolinealidad en la regresioacuten muacuteltiple

En el anaacutelisis de regresioacuten muacuteltiple los coeficientes de regresioacuten a menudo se vuelven

confiables conforme aumenta el grado de correlacioacuten entre las variables independie

existe un alto nivel de correlacioacuten entre algunas de las variables independientes nos enfrenun problema que los estadiacutesticos llaman multicolinealidad

La multicolinealidad puede presentarse si deseamos estimar la recuperacioacuten de las ventaempresa y utilizamos tanto el nuacutemero de vendedores empleados como sus salarios totales Cvalores asociados con estas dos variables independientes tienen una correlacioacuten alta neceusar soacutelo un conjunto de ellos para realizar nuestra estimacioacuten De hecho al agregar una segriable que estaacute correlacionada con la primera se distorsionan los valores de los coeficientgresioacuten Sin embargo a menudo podemos predecir bien Y incluso cuando haya multicoline

Consideremos un ejemplo donde existe multicolinealidad para ver coacutemo afecta a la regresrante los 12 meses pasados el gerente del restaurante Pizza Shack ha estado poniendo unaanuncios en el perioacutedico local Los anuncios se programan y pagan el mes anterior a que ap

Un ejemplo demulticolinealidad

Definicioacuten y efecto dela multicolinealidad

9703ᎏ

0082

29109 3ᎏ

0491 6Prueba de lasignificancia de laregresioacuten en elproblema del Serviciode Contribuciones

Anaacutelisis devarianza parala regresioacuten

Prueba F de laregresioacuten como

un todo

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 29 1088 9 7029 118 52 0Er r or 6 0 4912 0 0819Tot al 9 29 6000

FIGURA 13-5Salida de Minitabanaacutelisis devarianza

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2556

Cada anuncio contiene un cupoacuten que permite llevarse dos pizzas pagando solamente la de mcio El gerente recolectoacute los datos de la tabla 13-4 y le gustariacutea utilizarlos para predecir las vpizzas

En las figuras 13-6 y 13-7 se dieron los resultados de Minitab para las regresiones respelas ventas totales sobre el nuacutemero de anuncios y sobre el costo

Para la regresioacuten sobre el nuacutemero de anuncios tenemos que el valor t observado es 395grados de libertad y un nivel de significancia de ϭ 001 se encontroacute que el valor t criacuteticdo de la tabla 2 del apeacutendice) es 3169 Como t o Ͼ t c (o de manera equivalente como p es m001) concluimos que el nuacutemero de anuncios es una variable explicativa altamente signifilas ventas totales Note tambieacuten que r 2 ϭ 610 de modo que el nuacutemero de anuncios explximadamente el 61 de la variacioacuten en las ventas de pizzas

Para la regresioacuten sobre el costo de los anuncios el valor t observado es 454 de modo qude los anuncios es una variable explicativa de las ventas totales todaviacutea maacutes significativa que ro de anuncios (para los que el valor t observado fue soacutelo 395) En esta regresioacuten r 2 ϭ 673

el costo de los anuncios explica aproximadamente el 67 de la variacioacuten de las ventas de pizComo ambas variables explicativas son altamente significativas por siacute mismas intentam

zar ambas en una regresioacuten muacuteltiple El resultado se presenta en la figura 13-8La regresioacuten muacuteltiple es altamente significativa como un todo ya que la p de ANOVA e

Uso de ambas varia-bles explicativas enuna regresioacuten muacuteltiple

Dos regresionessimples

Datos de ventas y anun-cios para el restaurantePizza Shack

Tabla 13-4 X 1 X 2 Y

Nuacutemero Costo de anuncios Venta tode anuncios publicados de pizz

Mes publicados (cientos de doacutelares) (miles de d

Mayo 12 139 436

Junio 11 120 380

Julio 9 93 301

Agosto 7 97 353

Septiembre 12 123 464

Octubre 8 114 342

Noviembre 6 93 302

Diciembre 13 143 407

Enero 8 102 385

Febrero 6 84 226

Marzo 8 112 376

Abril 10 111 352

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esVENTAS = 16 9 + 2 08 ANUNCI OS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 16 937 4 982 3 40 0 007ANUNCI OS 2 0832 0 5271 3 95 0 003

s = 4 206 R- s q = 61 0

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 1 276 31 276 31 15 62 Er r or 10 176 88 17 69Tot a l 11 453 19

Figura 13-6

Regresioacuten de lasventas sobre elnuacutemero deanuncios conMinitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2656

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2756

gar el nuacutemero de anuncios como segunda variable explicativa ademaacutes del costo de los anuncios eplica nada maacutes alrededor del 1 adicional de la variacioacuten de las ventas totales

En este punto es justo preguntarse iquestqueacute variable realmente explica la variacioacuten de las ventotales en la regresioacuten muacuteltiple La respuesta es que ambas la explican pero no podemos separ

sus contribuciones individuales debido a que estaacuten altamente correlacionadas entre siacute E

consecuencia sus coeficientes en la regresioacuten muacuteltiple tienen errores estaacutendar altos valore

calculados relativamente bajos y valores prob Ͼ | t | relativamente altos

iquestDe queacute manera nos afecta esta multicolinealidad Todaviacutea podemos hacer predicciones relativmente precisas cuando se encuentra presente note que para la regresioacuten muacuteltiple (la salida se dala figura 13-8) el error estaacutendar de la estimacioacuten que determina el ancho de los intervalos de co

fianza para las predicciones es 3989 mientras que para la regresioacuten simple con el costo de los anucios como variable explicativa (salida en la figura 13-7) tenemos se ϭ 3849 Lo que no podemhacer es predecir con mucha precisioacuten coacutemo cambiaraacuten las ventas si aumentamos en uno el nuacutemede anuncios La regresioacuten muacuteltiple dice que b1 ϭ 0625 (esto es cada anuncio aumenta las ventotales de pizzas alrededor de $625) pero el error estaacutendar de este coeficiente es 112 (es decir apximadamente $1120)

Las contribucionesindividuales nopueden separarse

Ejercicios 134

Ejercicios de autoevaluacioacuten

EA 13-4 Edith Pratt es una ocupada ejecutiva de una compantildeiacutea de transporte de carga a nivel nacional y va tara una junta porque no encuentra la salida de la regresioacuten muacuteltiple elaborada por un asistente Si la regsioacuten total es significativa al nivel 005 ella desea usar las salida de computadora como evidencia para fudamentar algunas ideas que expondraacute en la reunioacuten Sin embargo su ayudante estaacute enfermo De hectoda la informacioacuten que tiene de la regresioacuten muacuteltiple es un trozo de papel con los siguientes datos

Regresioacuten paraEdith Pratt

SCR 8724 con gl

SCE con 17 gl

SCT 10236 con 24 gl

Como el papel ni siquiera tiene todos los nuacutemeros Edith ha concluido que no es uacutetil Usted sin embardebe saber maacutes que ella iquestPuede Edith entrar en la junta o debe seguir buscando la salida de computador

EA 13-5 Una pequentildea liacutenea aeacuterea de Nueva Inglaterra realizoacute una encuesta sobre sus 15 terminales y obtuvo losguientes datos para el mes de febrero donde

VENTAS ϭ ingreso total seguacuten el nuacutemero de boletos vendidos (en miles de doacutelares)

PROMOCϭ cantidad gastada en promociones de la liacutenea aeacuterea en el aacuterea (en miles de doacutelares)

COMPET ϭ nuacutemero de liacuteneas aeacutereas que compiten en esa terminal

GRATIS ϭ nuacutemero de pasajeros que vuelan gratis (por diferentes razones)

Sugerencia el concepto de hacer infe-rencias respecto a una regresioacuten muacutelti-ple es justo lo mismo que se hizo en elcapiacutetulo 12 cuando hicimos inferencias

respecto a una recta de regresioacuten excepto que ahora se em-

plean dos o maacutes variables independientes Advertencia lamulticolinealidad es un problema que debe manejarse enla regresioacuten muacuteltiple y es necesario desarrollar una com-prensioacuten con sentido comuacuten Recuerde que todaviacutea puedehacer predicciones precisas cuando estaacute presente Pero re-cuerde tambieacuten que no puede decir con mucha precisioacuten

cuaacutento cambiaraacute la variable dependiente si ldquomanipulardquo lavariables independientes Entonces el objetivo debe seminimizar la multicolinealidad Sugerencia la mejor regresioacuten muacuteltiple es la que explica la relacioacuten entre los datos asentildealar la responsabilidad de la mayor proporcioacuten de la va

riacioacuten en la variable dependiente con el menor nuacutemero dvariables independientes Advertencia no es una buenidea incluir demasiadas variables independientes soacutelo porque cuenta con una computadora y un paquete de softwarpara estadiacutestica

SUGERENCIAS

Y

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2856

Ventas (doacutelares) Promoc (doacutelares) Compet Gratis

793 25 10 3

2001 55 8 6

1632 60 12 9

2001 79 7 16

1460 52 8 15

1777 76 12 9

309 20 12 8

2919 90 5 10

1600 40 8 43394 96 5 16

1596 55 11 7

863 30 12 6

2375 60 6 10

1072 50 10 4

1550 35 10 4

a) Utilice la siguiente salida de Minitab para determinar la ecuacioacuten de regresioacuten que mejor se ara la liacutenea aeacuterea

La ec uaci oacuten de r egr es i oacuten esVENTAS ϭ 172 ϩ 25 9 PROMOVϪ 13 2 COMPET Ϫ 3 04 GRATI S

Pr onos t i cador Coef Des vEs t Coci ent e - t Cons t ant e 172 34 51 38 3 35 0PROMOV 25 950 4 877 5 32 0COMPET - 13 238 3 686 - 3 59 0GRATI S - 3 041 2 342 - 1 30 0

b) iquestLos pasajeros que vuelan gratis ocasionan una disminucioacuten significativa en las ventas Fpruebe las hipoacutetesis apropiadas Use ϭ 005

c) iquestUn incremento de $1000 en las promociones cambia las ventas en $28000 o el cambio ecativamente diferente de $28000 Formule y pruebe las hipoacutetesis adecuadas Use ϭ 010

d) Calcule un intervalo de confianza del 90 para el coeficiente de la pendiente de la COMPET

Aplicaciones

13-22 Mark Lowtown publica el perioacutedico Mosquito Junction Enquirer y tiene problemas para predectidad de papel perioacutedico que necesita imprimir diariamente Eligioacute aleatoriamente 27 diacuteas del arior y registroacute la siguiente informacioacuten

PESO ϭ peso en libras de papel perioacutedico para la edicioacuten de ese diacutea

CLASIFICADOS ϭ nuacutemero de anuncios clasificados

PUBLICIDAD ϭ nuacutemero de anuncios publicitarios

PLANA COMPLETA ϭ nuacutemero de anuncios a una plana

Utilizando Minitab para hacer una regresioacuten de PESO sobre las otras tres variables Mark obtuguiente salida

Pr onos t i cador Coef Des vEs t Coci ent e- t Cons t ant e 1072 95 872 43 1 23 0CLASI FI CADOS 0 251 0 126 1 99 0PUBLI CI DAD 1 250 0 884 1 41 0PLANA COMPLETA 250 66 67 92 3 69 0

a) Mark siempre ha pensado que cada anuncio publicitario utiliza al menos 3 libras de papel iquestsioacuten le da una razoacuten significativa para dudar esto al nivel del 5

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2956

b) De manera similar Mark siempre ha creiacutedo que cada anuncio clasificado utiliza aproximmedia libra de papel iquestTiene ahora Mark una razoacuten significativa para dudar esto al nivel del

c) Mark vende espacios de anuncios de plana completa a los comerciantes locales a $30 la paacutegberaacute pensar en ajustar sus tarifas si el papel perioacutedico le cuesta $009 por libra Suponga costos son despreciables Establezca expliacutecitamente las hipoacutetesis y una conclusioacuten (Sugere

jando todo lo demaacutes constante cada anuncio adicional de plana completa tiene un costo de bras de papel ϫ $009 por libra ϭ $2256 El punto de equilibrio es 333333 libras iquestPor quel coeficiente de pendiente para PLANA COMPLETA es significativamente mayor que Mark no estaacute obteniendo ganancias y debe cambiar sus tarifas)

13-23 Para los datos del ejercicio 13-18 y un nivel de significancia de 010 iquestcuaacuteles variables son sign

mente explicativas de los resultados de los exaacutemenes (Habiacutea 12 estudiantes en la muestra) 13-24 Para los datos del ejercicio 13-18 y la siguiente salida de Minitab del procedimiento de regresiple hecho por Bill

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 3134 42 783 60Er r or 7 951 25 135 89Tot a l 11 4085 67

a) iquestCuaacutel es el valor observado de F b) A un nivel de significancia de 005 iquestcuaacutel es el valor criacutetico de F que se debe utilizar para d

si la regresioacuten como un todo es significativac) Basaacutendose en las respuestas a los incisos a) y b) iquestes la regresioacuten significativa como un tod

13-25 Remiacutetase al ejercicio 13-19 A un nivel de significancia de 001 iquestes la variable DISTANCIA uble explicativa significativa para VENTAS

13-26 Para los datos del ejercicio 13-19 y la siguiente salida adicional de Minitab al correr la regresioacuten

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 2861495 715374 102 39 0Er r or 18 125761 6896 7Tot a l 22 2987256

Al nivel de significancia de 005 iquestes la regresioacuten significativa como un todo

13-27 Henry Lander es el director de produccioacuten de la Alecos Corporation de Caracas Venezuela Hede que le ayude a determinar una foacutermula para predecir el ausentismo de los empacadores de chipoacutetesis es que la temperatura diaria promedio puede explicar el porcentaje de ausentismo Durios meses reuacutene datos ejecuta el procedimiento de regresioacuten simple y encuentra que la tempeplica 66 de la variacioacuten en el ausentismo Pero Henry no estaacute convencido de que eacuteste sea un cador satisfactorio Sugiere que la precipitacioacuten pluvial diaria podriacutea tambieacuten tener algo que vausentismo de modo que registra los datos correspondientes y hace una regresioacuten del ausentismte el tiempo de lluvias y obtiene un valor R2 de 059 ldquoiexclEurekardquo grita usted ldquoiexclLo tengo Con uticador que explica 66 y otro que explica 59 todo lo que tengo que hacer es una regresioacutenutilizando ambos y seguramente tendreacute un pronosticador casi perfectordquo Para su desaacutenimo sin la regresioacuten muacuteltiple tiene una R

2 de soacutelo 68 que es solamente un poco mejor que la variablperatura sola iquestCoacutemo puede explicar esta aparente discrepancia

13-28 Juan Armenlegg administrador de Rockyrsquos Diamond y Jewelry Store estaacute interesado en desamodelo para estimar la demanda del consumidor para su costosa mercanciacutea Como la mayoriacutea de

tes compran diamantes y joyas a creacutedito Juan estaacute seguro de que dos factores que deben influirmanda de los clientes son la tasa real de inflacioacuten anual y la tasa real de intereses sobre preacutestamprincipales bancos del paiacutes Explique algunos problemas que Juan podriacutea encontrar si fuera a dun modelo de regresioacuten basado en estas dos variables de prediccioacuten

13-29 Un nuevo programa de juegos Check That Model pide a los concursantes que especifiquen el nuacutenimo de paraacutemetros que necesitan para determinar si un modelo de regresioacuten muacuteltiple es signifimo un todo para ϭ 001 Usted ganoacute la apuesta con 4 paraacutemetros Use la siguiente informacioacutenterminar si la regresioacuten es significativa

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3056

R 2

ϭ 07452

SCE ϭ 1254

n ϭ 18

Nuacutemero de variables independientes ϭ 3

13-30 La Scottish Turist Agency estaacute interesada en el nuacutemero de turistas que entran al paiacutes cada semanrante la temporada alta Se recolectaron los siguientes datos

Turistas (Y ) ϭ nuacutemero de turistas que entran a Escocia en una semana (en miles)

Cambio (X 1)ϭ nuacutemero de libras escocesas compradas por $1 doacutelar

Precio (X 2) ϭ nuacutemero de libras escocesas cobradas por viaje redondo en camioacuten de Londres a Edimburgo

Promoc (X 3) ϭ cantidad gastada en promocioacuten del paiacutes (en miles de libras escocesas)Temp (X 4) ϭ temperatura media durante la semana en Edimburgo (en grados Celsius)

Turistas (Y ) Cambio (X 1) Precio (X 2) Promoc (X 3) Temp (X 4)

69 061 40 87 154

71 059 40 88 156

68 063 40 85 154

79 061 35 86 153

76 060 35 94 158

82 065 35 99 162

80 058 35 98 164

84 059 35 102 166

97 061 30 114 174

98 062 30 116 172

72 057 40 84 176

67 055 40 86 164

a) Utilice el paquete de software que tenga para determinar la ecuacioacuten de regresioacuten que mejote a los datos de la agencia de turismo

b) iquestEs la tasa de cambio una variable explicativa significativa Establezca y pruebe las hipoacutetesidas a un nivel de significancia de 010

c) Un incremento de 1000 libras en las promociones iquestaumenta el nuacutemero de turistas en maacutesEstablezca y pruebe las hipoacutetesis adecuadas para un nivel de significancia de 005

d) Calcule un intervalo de confianza del 95 para el coeficiente de la pendiente de Temp

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-4 Como SCT ϭ SCR ϩ SCE SCE ϭ SCT Ϫ SCR ϭ 10236 Ϫ 8724 ϭ 1512Como gl SCT ϭ gl SCR ϩ gl SCE gl SCR ϭ gl SCT Ϫ gl SCE ϭ 24 Ϫ 17 ϭ 7

Entonces F ϭ ϭ ϭ 1401

F CRiacuteT ϭ F (7 17 005) ϭ 261Como F OBS gt F CRIacuteT se concluye que la regresioacuten es significativa como un todo Edith debe conticando la salida de computadora de la regresioacuten para usarla en la junta

EA 13-5 De la salida de computadora se obti enen los siguientes resultadosa) VENTAS ϭ 17234 ϩ 25950PROMOC Ϫ13238COMPET Ϫ 3041GRATISb) H0 BGRATIS ϭ 0 H1 BGRATIS Ͻ 0 ϭ 005

Eacutesta es una prueba de una cola y el valor prob en los resultados es para la alternativa de dos c BGRATIS 0 De manera que para esta prueba el valor prob es 02212 ϭ 0111 Ͼ ϭ 00que no se puede rechazar H0 las ventas no disminuyen significativamente cuando aumenta ro de pasajeros que vuelan gratis

c) H0 BPROMOC ϭ 28 H1 BPROMOC 28 ϭ 010

87247ᎏᎏ

151217SCRk ᎏᎏ

SCE(n Ϫ k Ϫ 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3156

El valor observado t de los resultados de regresioacuten es

ϭ ϭ Ϫ0420

Con 11 grados de libertad y ϭ 010 en ambas colas combinadas los valores criacuteticos t parba son Ϯ1796 asiacute el valor observado estaacute dentro de la regioacuten de aceptacioacuten No se rechacambio en VENTAS para un incremento de una unidad ($1000) en PROMOC no es significate diferente de 28 ($28000)

d) Con 11 grados de libertad el valor t para un intervalo del 90 de confianza es 1796 por lo

tervalo esbCOMP Ϯ 1796sbCOMP

ϭ Ϫ13238 Ϯ 1796(3686)

ϭ Ϫ13238 Ϯ 6620 ϭ (Ϫ19858 Ϫ 6618)

La liacutenea aeacuterea puede tener una seguridad del 90 de que el ingreso por los boletos en una ofminuye entre $6600 y $19900 aproximadamente con cada liacutenea aeacuterea adicional que comp

135 Teacutecnicas de modelado

Dada una variable que deseamos explicar y un conjunto de variables explicativas potencialehaya varias ecuaciones de regresioacuten diferentes que podamos estudiar dependiendo de queacute explicativas incluyamos y de coacutemo lo hagamos Cada una de esas ecuaciones de regresioacutence como modelo Las teacutecnicas de modelado son las distintas formas en que podemos incluriables explicativas y verificar queacute tan apropiados son los modelos de regresioacuten Existen municas de modelado diferentes pero soacutelo veremos dos de las maacutes utilizadas

Datos cualitativos y variables ficticias

En todos los ejemplos de regresioacuten que hemos visto hasta ahora los datos manejados hanmeacutericos o cuantitativos Pero ocasionalmente nos enfrentaremos con una variable categoacuterilitativa En el problema del inicio el capiacutetulo el director de personal desea ver si el salarioun vendedor depende de su sexo En la tabla 13-5 repetimos los datos de dicho problema

Por el momento ignore la antiguumledad y utilice la teacutecnica desarrollada en el capiacutetulo 9 bar la diferencia entre las medias de dos poblaciones para ver si los hombres ganan maacutes qu

jeres Pruebe con ϭ 001 Si tomamos a los hombres como la poblacioacuten 1 y a las mujerespoblacioacuten 2 probaremos las siguientes hipoacutetesis

H0 1 ϭ 2 larr Hipoacutetesis nula no existe discriminacioacuten por sexo en los salarios base

H1 1 Ͼ 2 larr Hipoacutetesis alternativa se discrimina a las mujeres en su salario base

ϭ 001 larr Nivel de significancia

Revisioacuten del enfoqueanterior del problema

Buacutesqueda dediferentes modelos

25950 Ϫ 28ᎏᎏ

4877

(bPROMOC Ϫ 28)ᎏᎏ

sbPROMOC

Datos para el problemade discriminacioacuten porsexo

Tabla 13-5 Vendedores VendedorasAntiguumledad Salario base Antiguumledad Salario base(en meses) (en miles) (en meses) (en miles)

6 75 5 62

10 86 13 87

12 91 15 94

18 103 21 98

30 130

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3256

A continuacioacuten bosquejamos el anaacutelisis Si tiene problemas para seguirlo deberaacute repasamente la seccioacuten 93

n1 ϭ 5 n2 ϭ 4

x ෆ1 ϭ 97 x ෆ2 ϭ 8525

s2

1 ϭ 4415 s2

2 ϭ 2609

s2

p ϭ

ϭ

ϭ 3641

x ෆ1Ϫ x

ෆ2ϭ s pΊ ϩ

ϭ 128

t ϭ

ϭ

ϭ 092

Con siete grados de libertad el valor t criacutetico para una prueba de cola superior con ϭ 001 eComo el valor t observado de 092 es menor que 2998 no podemos rechazar H0

Entonces el anaacutelisis concluye que no parece haber discriminacioacuten por sexo en los salarPero recuerde que hasta ahora se han ignorado los datos de antiguumledad laboral para el anaacuteli

Antes de seguir vea el diagrama de dispersioacuten de los datos En la figura 13-9 los punto

corresponden a los hombres y los blancos a las mujeres El diagrama de dispersioacuten muestraridad que el salario base aumenta con los antildeos de antiguumledad pero si con la mirada sigue lo qla recta de regresioacuten notaraacute que los puntos negros tienden a estar arriba de ella y los blancos

La figura 13-10 da la salida de una regresioacuten del salario base sobre los meses de antiguumlelos resultados se ve que la antiguumledad es una variable explicativa altamente significativa

Ademaacutes r 2

ϭ 926 que indica que la variable meses de antiguumledad explica cerca del 9variacioacuten en el salario base La figura 13-11 contiene parte de la salida que no se vio antesbla de residuos Para cada punto el residuo es simplemente Y Ϫ Y ˆ que se reconoce como el

Una ldquomiradardquo a los

datos

El enfoque anterior nodetecta discriminacioacuten

(97 ndash 8525) ndash 0ᎏᎏ

128

( x ෆ1 ndash x ෆ2) ndash (1 Ϫ 2)H0

ᎏᎏᎏ

ˆ x ෆ1Ϫ

x ෆ2

1ᎏ

n2

1ᎏ

n1

4(4415) ϩ 3(2609)ᎏᎏᎏ5 ϩ 4 ndash 2

(n1 ndash 1)s21 ϩ (n2 ndash 1)s22ᎏᎏᎏ

n1 ϩ n2 ndash 2

FIGURA 13-9

Diagrama de dis-persioacuten de salariosbase contra mesesde antiguumledad

4 8 12 16 20 24 28

4

8

12

Meses de antiguumledad

S a l a r i o ( m i l e s d e d oacute l a r e s )

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3356

el ajuste de la recta de regresioacuten en ese punto En la figura 13-11 AJUST1 son los valores y RESI1 son los residuos

Tal vez la parte maacutes importante del anaacutelisis del resultado de una regresioacuten sea estusiduos Si la regresioacuten incluye todos los factores explicativos relevantes estos residuo

ser aleatorios Dicho de otro modo si los residuos muestran cualquier patroacuten no aleat

to indica que hay algo sistemaacutetico que afecta el proceso y que no hemos tomado en cu

manera que buscamos patrones en los residuos o para decirlo de forma maacutes pintoresca ldquopmos a los residuos hasta hacerlos hablarrdquo

Si observamos los residuos presentados en la figura 13-11 vemos que los primeros cincoson positivos De modo que para los vendedores tenemos Y ndash Y ˆ Ͼ 0 o Y Ͼ Y ˆ es decir laregresioacuten cae abajo de estos cinco puntos Tres de los cuatro uacuteltimos residuos son negaticonsiguiente para las vendedoras tenemos Y Ϫ Y ˆ Ͻ 0 o Y Ͻ Y ˆ asiacute que la recta de regresicuentra arriba de tres de los cuatro puntos Esto confirma lo que vimos al observar el diagdispersioacuten de la figura 13-9 Este patroacuten no aleatorio en los residuos sugiere que el sexo siacute etor determinante del salario base

iquestCoacutemo podemos incorporar el sexo de los vendedores dentro del modelo de regresioacutencemos utilizando un dispositivo llamado variable ficticia (o variable indicadora) Para lpuntos que representan a los vendedores esta variable tiene valor de 0 y para los cuatro purepresentan a las vendedoras valdraacute 1 Los datos de entrada para nuestra regresioacuten con variticias se dan en la tabla 13-6

Para los datos de la tabla 13-6 se ajusta una regresioacuten de la forma

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

Uso de variablesficticias

Deteccioacuten depatrones en losresiduos

ldquoPresionar a losresiduosrdquo

Anaacutel i s i s de r e gr e s i oacuten

La ec uac i oacuten de r e gr es i oacuten esSALARI O ϭ 5 81 ϩ 0 233 MESES

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t pCons t a nt e 5 8093 0 4038 14 39 0 000MESES 0 23320 0 02492 9 36 0 000

s ϭ 0 5494 R- s q ϭ 92 6

Anaacute l i s i s de va r i a nz aFUENTE GL SC MC F Re gr e s i oacuten 1 26 443 24 443 87 61 0Er r or 7 2 113 0 302Tot a l 8 28 556

FIGURA 13-10

Regresioacuten conMinitab del salariobase sobre losmeses deantiguumledad

RENGLOacuteN SALARI O AJ UST1 RESI 1

1 7 5 7 2085 0 2914992 8 6 8 1413 0 458684

3 9 1 8 6077 0 4922764 10 3 10 0069 0 2930545 13 0 12 8054 0 1946076 6 2 6 9753 - 0 7752977 8 7 8 8409 - 0 1409288 9 4 9 3073 0 0926649 9 8 10 7066 - 0 906558

FIGURA 13-11

Tabla de residuosde Minitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 556

Error Punto correspondienteen el plano

Punto observado

Plano formado a traveacutesde los puntos de la muestraY = a + b 1X 1 + b 2X 2^

a = ordenada Y

X 1

X 2

Y FIGURA 13-1

Plano de regresioacutenmuacuteltiple para 10datos

Podemos obtener a b1 y b2 los coeficientes del plano de regresioacuten resolviendo las ec13-2 13-3 y 13-4 Obviamente la mejor manera de calcular todas las sumas implicadas en ecuaciones es elaborar una tabla para recolectar y organizar la informacioacuten necesaria comen la regresioacuten simple Esto se presenta en la tabla 13-2 para el problema del IRS

Ahora utilizando la informacioacuten de la tabla 13-2 en las ecuaciones 13-2 13-3 y 13-4 obtres ecuaciones con tres constantes desconocidas (a b1 y b2)

272 ϭ 10a ϩ 441b1 ϩ 147b2

12005 ϭ 441a ϩ 19461b1 ϩ 6485b2

4013 ϭ 147a ϩ 6485b1 ϩ 2173b2

Cuando resolvemos estas tres ecuaciones de manera simultaacutenea obtenemos

a ϭ Ϫ13828

b1 ϭ Ϫ 0564

b2 ϭ Ϫ 1099

Sustituyendo estos tres valores en la ecuacioacuten de regresioacuten de dos variables (ecuacioacuten 13-l)mos una ecuacioacuten que describe la relacioacuten entre el nuacutemero de horas de trabajo en auditoriacuteaspo el nuacutemero de horas de computacioacuten y los impuestos no pagados descubiertos por el dep

to de auditoriacuteasY ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

ϭ Ϫ13828 ϩ 0564 X 1 ϩ 1099 X 2

El departamento de auditoriacuteas puede utilizar esta ecuacioacuten mensualmente para estimardad de impuestos no pagados que va a descubrir

Suponga que el IRS desea aumentar la cantidad de detecciones de impuestos no pagados ete mes Como los auditores capacitados son escasos el IRS no tiene la intencioacuten de contratnal adicional El nuacutemero de horas de trabajo en auditoriacuteas entonces permaneceraacute en el niv

Uso de la ecuacioacutende regresioacuten muacuteltiplepara estimaciones

Obtencioacuten de a b 1y b 2 resolviendo lasecuaciones 13-213-3 y 13-4

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 656

tubre alrededor de 4300 horas Pero con el fin de aumentar las detecciones de impuestos no p

el IRS espera aumentar el nuacutemero de horas en computadora a cerca de 1600 Como resultad X 1 ϭ 43 larr 4300 horas de trabajo en auditoriacuteas de campo

X 2 ϭ 16 larr 1600 horas de tiempo en computadora

Sustituyendo estos valores en la ecuacioacuten de regresioacuten para el departamento de auditoriacuteanemos

Y ˆ ϭ Ϫ13828 ϩ 0564 X 1 ϩ 1099 X 2

Y ˆ ϭ Ϫ13828 ϩ (0564)(43) ϩ (1099)(16)

Y ˆ ϭ Ϫ13828 ϩ 24252 ϩ 17584

Y ˆ ϭ 28008 larr Detecciones estimadas de $28008000

Por tanto en el pronoacutestico para noviembre el departamento de auditoriacuteas espera enconevasioacuten de impuestos cercana a 28 millones de doacutelares para esta combinacioacuten de factores

Hasta este punto nos hemos referido a a como la ordenada Y y a b1 y b2 como las pendieplano de regresioacuten muacuteltiple Pero para ser maacutes precisos debemos decir que estas constantericas son los coeficientes de regresioacuten estimados La constante a es el valor de Y ˆ (en este catimacioacuten de los impuestos no pagados) si tanto X 1 como X 2 tienen valor cero Los coeficienb2 describen coacutemo los cambios en X 1 y X 2 afectan el valor de Y ˆ En el ejemplo del IRS pode

jar constante el nuacutemero de horas de trabajo de auditoriacutea de campo X 1 y cambiar el nuacutemerras en computadora X 2 Cuando hacemos esto el valor de Y ˆ aumenta en $1099000 por choras adicionales de tiempo en computadora Del mismo modo podemos fijar X 2 y encon

por cada aumento adicional de 100 horas en el nuacutemero de horas de trabajo de auditoriacuteas deY ˆ aumenta $564000

a b 1 y b 2 son loscoeficientes de re-gresioacuten estimados

Interpretacioacuten de laestimacioacuten

Sugerencia si tiene problemas para vi-sualizar lo que hace en realidad la regre-sioacuten muacuteltiple piense en el capiacutetulo 12 yrecuerde que una recta de regresioacuten des-

cribe la relacioacuten entre dos variables En la regresioacuten muacutelti-ple el plano de regresioacuten como el que se ve en la paacuteginaanterior describe la relacioacuten entre tres variables Y X 1 y X 2El concepto del plano de regresioacuten adecuado es el mismo

que el de la recta de regresioacuten adecuada es decir el qnimiza la suma de los cuadrados de las distancias vles entre los puntos de los datos y el plano en este cavez sea uacutetil recordar que cada variable independienteser responsable de cierta variacioacuten en la variable diente La regresioacuten muacuteltiple es soacutelo una manera dvarias variables independientes para hacer un promejor de la variable dependiente

SUGERENCIAS

Y

SUPOSICIONES

Valores para ajustarel plano de miacutenimoscuadrados donden ϭ 10

Tabla 13-2 Y X 1 X 2 X 1Y X 2Y X 1Y 2 X 2

1 X 2

2

(1) (2) (3) (2) ϫ (1) (3) ϫ (1) (2) ϫ (3) (2)2 (3)2

29 45 16 1305 464 720 2025 256

24 42 14 1008 336 588 1764 196

27 44 15 1188 405 660 1936 225

25 45 13 1125 325 585 2025 169

26 43 13 1118 338 559 1849 169

28 46 14 1288 392 644 2116 196

30 44 16 1320 480 704 1936 256

28 45 16 1260 448 720 2025 256 28 44 15 1232 420 660 1936 225

27 43 15 1161 405 645 1849 225

272 441 147 12005 4013 6485 19461 2173 7uarr uarr uarr uarr uarr uarr uarr uarr

Y X 1 X 2 X 1Y X 2Y X 1X 2 X 21 X 22

Y ෆ ϭ 272

X ෆ1 ϭ 441

X ෆ2 ϭ 147

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 756

Ejercicios 132

Ejercicios de autoevaluacioacutenEA 13-1 Dado el siguiente conjunto de datos

a) Calcule el plano de regresioacuten muacuteltipleb) Prediga Y cuando X 1 ϭ 30 y X 2 ϭ 27

Y X 1 X 2

25 35 50

30 67 4211 15 85

22 03 14

27 46 36

19 20 13

EA 13-2 Se ha reunido la siguiente informacioacuten de una muestra aleatoria de arrendadores de departamentos en uciudad Se intenta predecir la renta (en doacutelares por mes) con base en el tamantildeo del departamento (nuacutemro de habitaciones) y la distancia al centro de la ciudad (en millas)

Renta Nuacutemero de Distancia(doacutelares) habitaciones al centro

360 2 1

1000 6 1450 3 2

525 4 3

350 2 10

300 1 4

a) Calcule la ecuacioacuten de miacutenimos cuadrados que relacione mejor estas tres variablesb) Si alguien busca un departamento de dos habitaciones a 2 millas del centro iquestqueacute renta debe esperar pag

Conceptos baacutesicos 13-7 Dado el siguiente conjunto de datos

a) Calcule el plano de regresioacuten muacuteltipleb) Pronostique Y cuando X 1 ϭ 105 y X 2 ϭ 136

Y X 1 X 2

114 45 132

166 87 187

205 126 198

294 197 254

76 29 228

138 67 178

285 174 146

13-8 Para el siguiente conjunto de datosa) Calcule el plano de regresioacuten muacuteltipleb) Prediga Y cuando X 1 ϭ 28 y X 2 ϭ 10

Y X 1 X 2

10 8 4

17 21 9

18 14 11

26 17 20

35 36 13

8 9 28

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 856

13-9 Dado el siguiente conjunto de datosa) Calcule el plano de regresioacuten muacuteltipleb) Pronostique Y cuando X 1 ϭ Ϫ1 y X 2 ϭ 4

Y X 1 X 2

6 1 3

10 3 Ϫ1

9 2 4

14 Ϫ2 7

7 3 2

5 6 Ϫ4

Aplicaciones

13-10 Sam Spade duentildeo y gerente general de Stationery Store estaacute preocupado por el comportamienventas de un modelo de reproductor de CD y casetes que se venden en la tienda Se da cuenta de ten muchos factores que podriacutean ayudar a explicarlo pero cree que la publicidad y el precio soncipales determinantes Sam reunioacute los siguientes datos

Ventas Publicidad Precio(unidades vend) (nuacutem de anuncios) (doacutelares)

33 3 125

61 6 115

70 10 140

82 13 130

17 9 145

24 6 140

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir las ventas a partir de la publicidad y b) Si la publicidad es 7 y el precio es $132 iquestqueacute ventas podriacutea pronosticar

13-11 Un productor de comida para cerdos desea determinar queacute relacioacuten existe entre la edad de un cerdo empieza a recibir un complemento alimenticio de reciente creacioacuten el peso inicial del anima

mento de peso en un periodo de una semana con el complemento alimenticio La siguiente infoes resultado de un estudio de ocho lechones

X 1 X 2 Y

Nuacutemero Peso inicial Edad inicial Aumentode lechoacuten (libras) (semanas) de peso

1 39 8 7

2 52 6 6

3 49 7 8

4 46 12 10

5 61 9 9

6 35 6 5

7 25 7 38 55 4 4

a) Calcule la ecuacioacuten de miacutenimos cuadrados que mejor describa estas tres variablesb) iquestCuaacutento podemos esperar que un cerdo aumente de peso en una semana con el complemento

ticio si teniacutea nueve semanas de edad y pesaba 48 libras 13-12 Una estudiante graduada que quiere comprar un auto Neptune usado investigoacute los precios Pien

antildeo del modelo y el nuacutemero de millas recorridas influyen en el precio de compra Los datos siguirresponden a 10 autos con precio (Y ) en miles de doacutelares antildeo ( X 1) y millas recorridas ( X 2) en ma) Encuentre (calcule) la ecuacioacuten de miacutenimos cuadrados que mejor relacione estas tres variabb) La estudiante desea comprar un Neptune 1991 con alrededor de 40000 millas recorridas

pronostica que pagaraacute

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 956

(Y ) X 2

Precio X 1 Millas(miles de doacutelares) Antildeo (miles)

299 1987 556

602 1992 184

887 1993 213

392 1988 469

955 1994 118

905 1991 364

937 1992 282

42 1988 44248 1989 349

574 1991 264

13-13 La Reserva Federal de Estados Unidos realiza un estudio preliminar para determinar la relacioacuten etos indicadores econoacutemicos y el cambio porcentual anual en el producto interno bruto (PIB) Dindicadores examinados son el monto del deacuteficit del gobierno federal (en miles de millones de del promedio industrial Dow Jones (el valor medio del antildeo) Los datos correspondientes a seis antilde

Y X 1 X 2

Cambio en el PIB Deacuteficit federal Dow Jones

25 100 2850

Ϫ10 400 2100

40 120 330010 200 2400

15 180 2550

30 80 2700

a) Encuentre (calcule) la ecuacioacuten de miacutenimos cuadrados que mejor describa los datosb) iquestQueacute porcentaje de cambio en el PIB se esperariacutea en un antildeo en el cual el deacuteficit federal fue

millones de doacutelares y el promedio Dow Jones fue 3000

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-1 a) Y X 1 X 2 X 1Y X 2Y X 1X 2 X 2

1 X 2

2

25 35 50 875 1250 175 1225 2500

30 67 42 2010 1260 2814 4489 1764

11 15 85 165 935 1275 225 7225

22 03 14 66 308 042 009 196

27 46 36 1242 972 1656 2116 1296

19 20 13 380 247 260 400 169

1 ෆ3 ෆ4 ෆ 1 ෆ8 ෆ ෆ6 ෆ 2 ෆ4 ෆ ෆ0 ෆ 4 ෆ7 ෆ3 ෆ ෆ8 ෆ 4 ෆ9 ෆ7 ෆ ෆ2 ෆ 7 ෆ7 ෆ ෆ9 ෆ7 ෆ 8 ෆ4 ෆ ෆ6 ෆ4 ෆ 1 ෆ3 ෆ1 ෆ ෆ5 ෆ0 ෆ

Las ecuaciones 13-2 13-3 y 13-4 se convierten en

Y ϭ na ϩ b1 X 1 ϩ b2 X 2 134 ϭ 6 a ϩ 186b1 ϩ 240 b2

X 1Y ϭ a X 1 ϩ b1 X 21 ϩb2 X 1 X 2 4738 ϭ 186a ϩ 8464b1 ϩ 7797b2

X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22 4972 ϭ 240a ϩ 7797b1 ϩ 13150b2

Al resolver estas ecuaciones de manera simultaacutenea se obtiene

a ϭ 203916 b1 ϭ 23403 b2 ϭ Ϫ13283

De modo que la ecuacioacuten de regresioacuten es Y ˆ ϭ 203916 ϩ 23403 X 1 Ϫ 13283 X 2b) Con X 1 ϭ 30 y X 2 ϭ 27

Y ˆ = 203916 ϩ 23403(30) Ϫ 13283(27) ϭ 2883

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1056

EA 13-2 a) En este problema Y ϭ renta X 1 ϭ nuacutemero de habitaciones X 2 ϭ distancia al centro

Y X 1 X 2 X 1Y X 2Y X 1X 2 X 2

1 X 2

2 Y 2

360 2 1 720 360 2 4 1 129600

1000 6 1 600 1000 6 36 1 1000000

450 3 2 1350 900 6 9 4 202500

525 4 3 2100 1575 12 16 9 272625

350 2 10 700 3500 20 4 100 122500

300 1 4 300 1200 4 1 16 90000

2985 18 21 11170 8535 50 70 131 1820225

Las ecuaciones 13-2 13-3 y 13-4 se convierten en

Y ϭ na ϩ b1 X 1 ϩb2 X 2 2985 ϭ 6a ϩ 18b1 ϩ 21b2

X 1Y ϭ a X 1 ϩ b1 X 21 ϩb2 X 1 X 2 11170 ϭ 18a ϩ 70b1 ϩ 50b2

X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22 8535 ϭ 21a ϩ 50b1 ϩ 131b2

Al resolver estas ecuaciones simultaacuteneas se obtiene

a ϭ 964581 b1 ϭ 1364847 b2 ϭ Ϫ24035

De manera que la ecuacioacuten de regresioacuten es

Y ˆ ϭ 964581 ϩ 1364847 X 1 Ϫ 24035 X 2

b) Cuando el nuacutemero de habitaciones ϭ 2 y la distancia al centro ϭ 2

Y ˆ ϭ 964581 ϩ 1364847(2) Ϫ 24035(2) ϭ $365

133 La computadora y la regresioacutenmuacuteltiple

En el capiacutetulo 12 y hasta donde vamos de eacuteste hemos presentado problemas simplificados y muestrasde tamantildeo pequentildeo Despueacutes del ejemplo de la seccioacuten anterior probablemente usted haya llegadoa la conclusioacuten de que no estaacute interesado en la regresioacuten si tiene que hacer los caacutelculos a mano Dehecho conforme aumenta el tamantildeo de las muestras y crece el nuacutemero de variables independientespara la regresioacuten hacer los caacutelculos incluso con la ayuda de una calculadora de bolsillo se convier-te en algo muy inconveniente

Sin embargo como administradores debemos manejar problemas complejos que requieren mues-tras maacutes grandes y variables independientes adicionales Como ayuda para resolver estos problemasmaacutes detallados utilizaremos una computadora que nos permitiraacute realizar un gran nuacutemero de caacutelcu-los en poco tiempo

Suponga que tenemos no una ni dos variables independientes sino un nuacutemero k de ellas X 1

X 2 X k Como antes sea n el nuacutemero de datos que se tienen La ecuacioacuten de regresioacuten que inten-tamos estimar es

Inconvenienciadel caacutelculo deregresiones a mano

Ecuacioacuten de estimacioacuten de regresioacuten muacuteltiple

Y ˆ ϭ

b1 X 1ϩ

b2 X 2ϩ ϩ

bk X k [13-5]

Ahora veremos coacutemo podemos utilizar una computadora para estimar los coeficientes de regresioacutenPara demostrar coacutemo una computadora maneja el anaacutelisis de regresioacuten muacuteltiple tomemos el pro-

blema del Servicio Interno de Contribuciones (IRS) de la seccioacuten anterior Suponga que el departa-mento de auditoriacuteas agrega a su modelo la informacioacuten correspondiente a las recompensas para losinformantes La dependencia desea incluir esta tercera variable independiente X 3 debido a que sien-

Demostracioacuten de laregresioacuten muacuteltipleen la computadora

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1156

te que existe cierta relacioacuten entre estas recompensas y el descubrimiento de impuestos no pEn la tabla 13-3 se registroacute la informacioacuten de los uacuteltimos 10 meses

Para resolver este problema la divisioacuten de auditoriacutea usoacute el procedimiento de regresioacutende Minitab Por supuesto todaviacutea no sabemos coacutemo interpretar la solucioacuten que proporciocomo veremos la mayor parte de los nuacutemeros dados en la solucioacuten corresponden muy de c

los estudiados en el contexto de regresioacuten simple

Salida de Minitab

Una vez que se introducen los datos y se eligen las variables dependiente e independientescalcula los coeficientes de regresioacuten y varios estadiacutesticos asociados con la ecuacioacuten de regrveraacute la salida del programa para el problema del IRS La figura 13-2 da la primera parte de la

1 La ecuacioacuten de regresioacuten De los nuacutemeros dados en la columna Coef se puede leercioacuten de estimacioacuten

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ b3 X 3

ϭ Ϫ45796 ϩ 0597 X 1 ϩ 1177 X 2 ϩ 0405 X 3

Podemos interpretar esta ecuacioacuten en una forma similar a la de la ecuacioacuten de regresioacutevariables en la paacutegina 558 Si se mantienen constantes el nuacutemero de horas de audicampo X 1 y el nuacutemero de horas de computadora X 2 y se cambian las recompeninformantes X 3 entonces el valor de Y ˆ aumentaraacute $405000 por cada $1000 pagadosformantes De igual manera al mantener X 1 y X 3 constantes se ve que por cada 1adicionales de tiempo de computadora Y ˆ aumentaraacute $1177000 Por uacuteltimo si se dej

Buacutesqueda e interpre-tacioacuten de la ecuacioacutende regresioacuten

Salida del programaMinitab

Uso de Minitab pararesolver problemasde regresioacuten muacuteltiple

Factores relacionadoscon el descubrimientode impuestos nopagados

Tabla 13-3 Horas en Impueauditoriacuteas Horas Recompensa pagde campo en computadora a informantes descub(cientos) (cientos) (miles) (mill

Mes X 1 X 2 X 3

Enero 45 16 71 2

Febrero 42 14 70 2

Marzo 44 15 72 2

Abril 45 13 71 2

Mayo 43 13 75 2

Junio 46 14 74 2

Julio 44 16 76 3

Agosto 45 16 69 2

Septiembre 44 15 74 2

Octubre 43 15 73 2

FIGURA 13-2

Salida de Minitabpara la regresioacuten

del ServicioInterno deContribuciones

Anaacutel i s i s de r e gr e s i oacuten

La ec ua ci oacuten de r egr es i oacuten es

DESCUBRE ϭ mdash45 0 ϩ 0 597 AUDI T ϩ 1 18 COMPUTADORA ϩ 0 405 RECOMPENS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e Ϫ45 796 4 878 Ϫ9 39 0 000AUDI T 0 50697 0 08112 7 36 0 000COMPUTADORA 1 17684 0 08407 14 00 0 000RECOMPENSA 0 40511 0 04223 9 59 0 000

s ϭ 0 2861 R- s q ϭ 98 3

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1256

tantes X 2 y X 3 se estima que 100 horas adicionales dedicadas a auditoriacuteas de campo descubri-raacuten $597000 adicionales de impuestos no pagados Observe que se redondearon los valoresproporcionados por la regresioacuten dada por Minitab (figura 13-2)

Suponga que en noviembre el IRS intenta dejar las horas de trabajo en auditoriacuteas de cam-po y las horas en computadora en sus niveles de octubre (4300 y 1500) pero decide aumen-tar las recompensas pagadas a los informantes a $75000 iquestCuaacutento de impuestos no pagadosesperan descubrir en noviembre Sustituyendo estos valores en la ecuacioacuten de regresioacuten esti-mada obtenemos

Y ˆ ϭ Ϫ45796 ϩ 0597 X 1 ϩ 1177 X 2 ϩ 0405 X 3

Y ˆ ϭ Ϫ45796 ϩ 0597(43) ϩ 1177(15) ϩ 0405(75)

Y ˆ ϭ Ϫ45796 ϩ 25671 ϩ 17655 ϩ 30375

Y ˆ ϭ 27905 larr Descubrimientos estimados $27905000

De modo que el departamento de auditoriacuteas espera descubrir aproximadamente $28 millonesde evasioacuten de impuestos en noviembre

2 Una medida de dispersioacuten el error estaacutendar de la estimacioacuten de la regresioacuten muacuteltiple Ya quehemos determinado la ecuacioacuten que relaciona a nuestras tres variables necesitamos una me-dida de la dispersioacuten alrededor de este plano de regresioacuten muacuteltiple En la regresioacuten simple laestimacioacuten es maacutes precisa conforme el grado de dispersioacuten alrededor de la regresioacuten es menorLo mismo es cierto para los puntos de la muestra que se encuentran alrededor del plano de re-gresioacuten muacuteltiple Para medir esta variacioacuten debemos utilizar de nuevo la medida conocida co-

mo error estaacutendar de la estimacioacuten

Medicioacuten de ladispersioacuten alrededordel plano de regre-sioacuten muacuteltiple usodel error estaacutendar dela estimacioacuten

Error estaacutendar de la estimacioacuten

se ϭ Ί [13-6]Y ndash Y ˆ )2ᎏᎏ

n Ϫ k Ϫ 1

donde

bull Y ϭ valores muestrales de la variable dependientebull Y ˆ ϭ valores correspondientes estimados con la ecuacioacuten de regresioacutenbull n ϭ nuacutemero de puntos de la muestrabull k ϭ nuacutemero de variables independientes (ϭ 3 en nuestro ejemplo)

El denominador de esta ecuacioacuten indica que en la regresioacuten muacuteltiple con k variables in-

dependientes el error estaacutendar tiene n Ϫ k Ϫ 1 grados de libertad Esto se debe a que los

grados de libertad se reducen de n en k ϩ 1 constantes numeacutericas a b1 b2 hellip b k que se

estimaron a partir de la misma muestra

Para calcular se observamos los errores individuales (Y Ϫ Y ˆ ) en el plano de regresioacuten ajus-tado los elevamos al cuadrado calculamos su media (dividiendo entre n Ϫ k Ϫ 1 en lugar den) y tomamos la raiacutez cuadrada del resultado Debido a la forma en que se calcula se se cono-ce a veces como raiacutez del error cuadraacutetico medio [o raiacutez de mse (mean-square error)] De lasalida de Minitab que usa s en lugar de se para denotar el error estaacutendar vemos que la raiacutez demse en el problema del Servicio Interno de Contribuciones es 0286 es decir $286000

Como en el caso de la regresioacuten simple podemos utilizar el error estaacutendar de la estimacioacuteny la distribucioacuten t para formar un intervalo de confianza alrededor de nuestro valor estimadoY ˆ En el problema de la evasioacuten de impuestospara 4300 horas de trabajo en auditoriacuteas de cam-po 1500 horas en computadora y $75000 de pago a informantes Y ˆ es $27905000 como es-timacioacuten de impuestos no pagados descubiertos y se es $286000 Si deseamos construir unintervalo de confianza del 95 alrededor de esta estimacioacuten de $27905000 miramos enla tabla 2 del apeacutendice en la columna del 5 y localizamos ahiacute el rengloacuten correspondiente a

Intervalos deconfianza para Y ˆ

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1356

n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad El valor apropiado de t para nuestracioacuten del intervalo es de 2447 En consecuencia podemos calcular los liacutemites de nutervalo de confianza como sigue

Y ˆ ϩ t (se) ϭ 27905000 ϩ (2447)(286000)

Y ˆ ϩ t(se) ϭ 27905000 ϩ 699800

Y ˆ ϩ t(se) ϭ 28604800 larr Liacutemite superior

Y ˆ Ϫ t (se) ϭ 27905000 Ϫ (2447)(286000)

Y ˆ ϩ t(se) ϭ 27905000 ndash 699800

Y ˆ ϩ t(se) ϭ 27205200 larr Liacutemite inferior

Con un nivel de confianza del 95 el departamento de auditoriacuteas puede sentirse sque los descubrimientos reales estaraacuten en este intervalo que va de $27205200 a $28Si el IRS desea usar un nivel de confianza menor como 90 puede reducir el intevalores para la estimacioacuten de descubrimientos de impuestos no pagados Igual que cgresioacuten simple podemos utilizar la distribucioacuten normal estaacutendar (tabla 1 del apeacutendaproximar la distribucioacuten t siempre que los grados de libertad (n menos el nuacutemero cientes de regresioacuten estimados) sea un nuacutemero mayor que 30

Al antildeadir la tercera variable independiente (recompensas a informantes) iquestmejoroacuteregresioacuten Como se mide la dispersioacuten de los datos alrededor del plano de regresioacutenmenores de se deberiacutean indicar mejores regresiones Para la regresioacuten de dos variablecimos con anterioridad en este mismo capiacutetulo se resultoacute ser 1076 Como al agregarra variable se se redujo a 0286 vemos que siacute mejoroacute el ajuste de la regresioacuten en este Sin embargo en general no es cierto que al agregar variables siempre se reduzc

3 El coeficiente de determinacioacuten muacuteltiple Al estudiar el anaacutelisis de correlacioacuten simpmos la fuerza de la relacioacuten entre dos variables utilizando el coeficiente de determinla muestra r 2 Este coeficiente de determinacioacuten es la fraccioacuten de la variacioacuten total riable dependiente Y que se explica con la ecuacioacuten de estimacioacuten

Similarmente en la correlacioacuten muacuteltiple mediremos la fuerza de la relacioacuten entre trbles utilizando el coeficiente de determinacioacuten muacuteltiple R

2 o su raiacutez cuadrada R (el cte de correlacioacuten muacuteltiple) Este coeficiente de determinacioacuten muacuteltiple es tambieacuten la

que representa la porcioacuten de la variacioacuten total de Y que ldquoexplicardquo el plano de regr

Note que la salida del programa da el valor 983 para R2 Esto nos dice que las tr

bles independientes explican el 983 de la variacioacuten total de impuestos no pagadobiertos Para la regresioacuten de dos variables hecha antes R2 es soacutelo 0729 asiacute que las trabajo en auditoriacutea de campo y las horas en computadora explican el 729 de la vaagregar las recompensas a los informantes explica el 254 restante de la variacioacuten

Todaviacutea no hemos explicado los nuacutemeros en las columnas etiquetadas con Desvciente t y p de la figura 13-2 Estos nuacutemeros se utilizaraacuten para hacer inferencias acercano de regresioacuten de la poblacioacuten tema que se trataraacute en la seccioacuten 13-4

Uso del coeficientede determinacioacutenmuacuteltiple

Valor de variablesadicionales

Interpretacioacuten delintervalo deconfianza

Ya nadie calcula regresiones a mano hayotras cosas maacutes interesantes en queacute ocu-par nuestro tiempo Se explicoacute la teacutecnicacalculando las soluciones a mano para

que no tenga que pensar en su computadora como en unaldquocaja negrardquo que hace muchas cosas uacutetiles que no puedeexplicar Sugerencia el valor real de usar la computadorapara calcular regresiones muacuteltiples es que puede manejarmuchas variables independientes y obtener una mejor ecua-

cioacuten de estimacioacuten que puede medir si agregar otrble independiente realmente mejora los resultados yposible observar con rapidez el comportamiento de

indica la proporcioacuten de la variacioacuten total de la variapendiente que se explica con las variables indepenLa computadora hace todo el trabajo tedioso mdashsin semdash y le deja tiempo para el trabajo maacutes importcomprender los resultados y usarlos para tomar mdecisiones

SUGERENCIASY

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1456

La ec uac i oacuten de r egr es i oacuten esY = - 12 75 + 17 1 X1 + 0 54 1 X2 - 0 17 4 X3

Pr onos t i c ador Coe f De s vEs t Coc i e nt e - t pCons t a n t e - 1275 2699 - 0 47 0 719X1 17 059 6 908 2 47 0 245X2 0 5406 0 3144 1 72 0 335X3 - 0 1743 0 1005 - 1 73 0 333

s = 396 1 R- s q = 87 2

b) iquestQueacute porcentaje de la variacioacuten total del nuacutemero de solicitudes urgentes de devolucioacuten de impuestosexplica esta ecuacioacuten

c) Para este antildeo el iacutendice econoacutemico es 169 la poblacioacuten residente en un radio de una milla desde la

oficina es 10212 habitantes y el ingreso promedio en Ithaca es $26925 iquestCuaacutentas solicitudes urgen-tes de devolucioacuten de impuestos debe Pam esperar procesar entre el 1 de marzo y el 15 de abril

Conceptos baacutesicos 13-14 Dado el siguiente conjunto de datos utilice el paquete de software que tenga disponible para encontrar la

ecuacioacuten de regresioacuten de mejor ajuste y responda a lo siguientea) iquestCuaacutel es la ecuacioacuten de regresioacutenb) iquestCuaacutel es el error estaacutendar de la estimacioacutenc) iquestCuaacutel es el valor de R

2 para esta regresioacutend) iquestCuaacutel es el valor pronosticado para Y cuando X 1 ϭ 58 X 2 ϭ 42 y X 3 ϭ 51

Y X 1 X 2 X 3

647 35 53 85809 74 16 26246 25 63 45439 37 94 88777 55 14 36206 83 92 25669 67 25 27343 12 22 13

Ejercicios 133

Ejercicios de autoevaluacioacuten

EA 13-3 Pam Schneider posee y opera un despacho de contadores en Ithaca Nueva York Ella piensa que seriacutea uacutetilpredecir el nuacutemero de solicitudes urgentes de devolucioacuten de impuestos que le pediraacuten durante el ajetrea-do periodo del 1 de marzo al 15 de abril para poder planear mejor sus necesidades de personal duranteesta eacutepoca Tiene la hipoacutetesis de que varios factores pueden ser uacutetiles para su pronoacutestico Los datos de es-tos factores y el nuacutemero de solicitudes urgentes de devolucioacuten de impuestos de antildeos pasados son

Y X 2 Nuacutemero de

Poblacioacuten solicitudesresidente X 3 de devolucioacuten

X 1 en un radio Ingreso urgentesIacutendice de una milla promedio (1 de marzo

econoacutemico desde la oficina en Ithaca a 15 de abril)

99 10188 21465 2306106 8566 22228 1266100 10557 27665 1422129 10219 25200 1721179 9662 26300 2544

a) Use el siguiente resultado de Minitab para determinar la ecuacioacuten de regresioacuten maacutes adecuada para es-

tos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1556

13-15 Dado el siguiente conjunto de datos utilice el paquete de software que tenga a su disposicioacuten patrar la ecuacioacuten de regresioacuten de mejor ajuste y responda a lo siguientea) iquestCuaacutel es la ecuacioacuten de regresioacutenb) iquestCuaacutel es el error estaacutendar de la estimacioacutenc) iquestCuaacutel es el valor de R2 para esta regresioacutend) Deacute un intervalo de confianza para la estimacioacuten del 95 para el valor Y cuando los valores X

y X 4 son 524 416 358 y 3 respectivamente

X 1 X 2 X 3 X 4 Y

214 629 219 Ϫ2 228

517 407 429 5 937418 818 698 2 649

118 410 909 Ϫ4 192

716 226 129 8 558

919 615 309 1 231

Aplicaciones

1316 Las estaciones de policiacutea en Estados Unidos estaacuten interesadas en predecir el nuacutemero de arrestodos que deberaacuten procesar cada mes para programar mejor a los empleados de oficina En los daricos el nuacutemero promedio de arrestos (Y ) cada mes tiene influencia del nuacutemero de oficiales en

policiaca ( X 1) la poblacioacuten de la ciudad en miles ( X 2) y el porcentaje de personas desempleadasdad en miles ( X 3) Los datos de estos factores en 15 ciudades se presentan en la tablaa) Utilice el paquete de software que tenga disponible para determinar la ecuacioacuten de regresioacuten

jor se ajuste a estos datosb) iquestQueacute porcentaje de la variacioacuten total en el nuacutemero de arrestos (Y ) explica esta ecuacioacutenc) El departamento de policiacutea de ChapelBoro desea pronosticar el nuacutemero de arrestos mensua

pelBoro tiene una poblacioacuten de 75000 habitantes 82 elementos en su fuerza policiaca y utaje de desempleo del 105 iquestCuaacutentos arrestos pronostica para cada mes

Nuacutemero promedio Nuacutemero de oficiales Tamantildeo de la ciudad (X 2) Porcende arrestos mensuales (Y ) en la fuerza (X 1) en miles de habitantes desemp

3906 68 816 4

5043 94 751 3

6284 125 973 5

7456 175 1235 8

5852 113 1184 11

4503 82 654 9

3278 46 616 12

2605 32 543 18

4775 89 974 4

3898 67 824 6

3124 47 564 8

3675 59 713 7

3744 61 674 9

4946 87 963 11

4875 92 864 4

13-17 Estamos intentando predecir la demanda anual (DEMAND) de cierto producto utilizando las svariables independientes

PRECIO ϭ precio del producto (en doacutelares)

INGRESO ϭ ingreso del consumidor (en doacutelares)

SUB ϭ precio de un bien sustituto (en doacutelares)

( Nota Un bien sustituto es aquel que puede suplir a otro bien Por ejemplo la margarina es untituto de la mantequilla)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1656

Se recolectaron datos correspondientes al periodo 1982-1996

Antildeo Demanda Precio ($) Ingreso ($) Sub ($)

1982 40 9 400 101983 45 8 500 141984 50 9 600 121985 55 8 700 131986 60 7 800 111987 70 6 900 151988 65 6 1000 161989 65 8 1100 17

1990 75 5 1200 221991 75 5 1300 191992 80 5 1400 201993 100 3 1500 231994 90 4 1600 181995 95 3 1700 241996 85 4 1800 21

a) Utilice el paquete de software que tenga disponible para encontrar la ecuacioacuten de regresioacuten ajuste para estos datos

b) iquestSon los signos (ϩ o Ϫ) de los coeficientes de regresioacuten de las variables independientes los qperan Deacute una explicacioacuten breve ( Nota Eacutesta no es una pregunta estadiacutestica soacutelo necesita pesignifican los coeficientes de regresioacuten)

c) Establezca e interprete el coeficiente de determinacioacuten muacuteltiple del problemad) Establezca e interprete el error estaacutendar de la estimacioacuten para el problemae) Seguacuten la ecuacioacuten de regresioacuten obtenida iquestqueacute valor de DEMAND predeciriacutea si el precio de

ductos fue $6 el ingreso del consumidor $1200 y el precio del bien sustituto $17 13-18 Bill Buxton profesor de estadiacutestica de una prominente escuela de administracioacuten tiene un prof

tereacutes en los factores que afectan el desempentildeo de los estudiantes en los exaacutemenes El examen psemestre anterior tuvo una distribucioacuten de calificaciones amplia pero Bill tiene la certeza de qfactores explican esa distribucioacuten permite a sus estudiantes que estudien en tantos libros comoca el coeficiente de inteligencia de los estudiantes variacutea tienen distintas edades y difieren losque dedican a estudiar Con el propoacutesito de desarrollar una foacutermula de prediccioacuten para las califde los exaacutemenes Bill pidioacute a cada estudiante que respondiera al final del examen preguntas refe

tiempo de estudio y nuacutemero de libros utilizados Los registros que teniacutea Bill ya incluiacutean el coefiinteligencia y la edad de modo que reunioacute los datos del grupo y corrioacute la regresioacuten muacuteltiple deLa salida de la corrida de Bill fue la siguiente

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t Con s t a nt e minus49 948 41 55 minus1 20 0HORAS 1 06931 0 98163 1 09 0CI 1 36460 0 37627 3 63 0LI BROS 2 03982 1 50799 1 35 0EDAD minus1 79890 0 67332 minus2 67 0

s = 11 657 R- s q = 76 7

a) iquestCuaacutel es la ecuacioacuten de regresioacuten de mejor ajuste para estos datos

b) iquestQueacute porcentaje de la variacioacuten en las calificaciones se explica con esta ecuacioacutenc) iquestQueacute calificacioacuten esperariacutea usted para un estudiante de 21 antildeos de edad con un coeficiente gencia (CI) de 113 que estudioacute durante cinco horas y utilizoacute tres libros diferentes

13-19 La compantildeiacutea de tiendas de abarrotes Twenty-Two estaacute planeando expandir su cadena Como ayudleccionar los lugares donde abriraacute las nuevas tiendas recolectoacute datos de las ventas semanales de casus 23 tiendas Para explicar la variabilidad de las ventas semanales tambieacuten reunioacute informacioacutencribe cuatro variables que se cree estaacuten relacionadas con las ventas Las variables se definen como

VENTAS ϭ ventas semanales promedio en cada tienda en miles de doacutelares

AUTOS ϭ volumen promedio de traacutensito de automoacuteviles por semana en miles de autos

ENTRADA ϭ facilidad de entradasalida medida en una escala de 1 a 100

INGANUAL ϭ ingreso anual promedio por familia en el aacuterea en miles de doacutelares

DISTANCIA ϭ distancia en millas desde la tienda al supermercado maacutes cercano

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1756

Los datos se analizaron con Minitab y la salida es la siguiente

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t Cons t a nt e 175 37 92 62 1 89 0 0AUTOS - 0 028 0 315 minus0 09 0 9ENTRADA 3 775 1 272 2 97 0 0I NGANUAL 1 990 4 510 0 44 0 6DI STANCI A 212 41 28 090 7 56 0 0

s = 85 587 R- s q = 95 8

a) iquestCuaacutel es la ecuacioacuten de regresioacuten de mejor ajuste dada por Minitab

b) iquestCuaacutel es el error estaacutendar de la estimacioacuten para esta ecuacioacutenc) iquestQueacute fraccioacuten de la variacioacuten en las ventas se explica con esta regresioacutend) iquestQueacute ventas predeciriacutea para una tienda localizada en un vecindario que tuvo un ingreso anu

milia de $20000 estaba a 2 millas del supermercado maacutes cercano se encontraba en una calvolumen promedio semanal de traacutensito de 100000 autos y con una facilidad de entrada de

13-20 Rick Blackburn estaacute pensando en vender su casa Con el fin de decidir el precio que pediraacute poreunido datos de 12 ventas recientes Registroacute el precio de venta (en miles de doacutelares) el nuacutemercuadrados de construccioacuten (en cientos de pies cuadrados) el nuacutemero de pisos el nuacutemero de bantiguumledad de la casa (en antildeos)

Precio de venta Pies cuad Pisos Bantildeos Antiguumledad

4965 89 1 10 2

6795 95 1 10 68115 126 2 15 11

8160 129 2 15 8

9150 190 2 10 22

9525 176 1 10 17

10035 200 2 15 12

10425 206 2 15 11

11265 205 1 20 9

14970 251 2 20 8

16065 227 2 20 18

23250 408 3 40 12

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de

de mejor ajuste para los datosb) iquestCuaacutel es el valor de R2 para esta ecuacioacutenc) Si la casa de Rick tiene 1800 pies cuadrados (ϭ 180 cientos de pies cuadrados) un piso

y seis antildeos de antiguumledad iquestqueacute precio de venta puede esperar Rick 13-21 La Allegheny Steel Corporation ha estado buscando los factores que influyen en la cantidad de

millones de toneladas) que puede vender cada antildeo La administracioacuten sospecha que los siguientfactores principales la tasa anual de inflacioacuten del paiacutes el precio promedio por tonelada del acetado que acota los precios (en doacutelares) de Allegheny y el nuacutemero de automoacuteviles (en millonesfabricantes de autos de Estados Unidos planean producir ese antildeo Se recolectaron los datos de losiete antildeos

Y X 2 X 3

Millones X 1 Cota de Nuacutemero

de tons Tasa de importa- deAntildeo vendidas inflacioacuten ciones automoacuteviles

1993 42 31 310 62

1992 31 39 500 51

1991 40 75 220 57

1990 47 107 450 71

1989 43 155 435 65

1988 37 130 260 61

1987 35 110 305 59

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1856

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de regresioacutende mejor ajuste para los datos

b) iquestQueacute porcentaje de la variacioacuten total de la cantidad de acero vendido (en millones de toneladas) porAllegheny cada antildeo explica esta ecuacioacuten

c) iquestCuaacutentas toneladas de acero deberaacute esperar Allegheny vender en un antildeo en el que la tasa de inflacioacutenes 71 los fabricantes de automoacuteviles norteamericanos planean producir 60 millones de autos y la co-ta promedio del acero importado por tonelada es $350

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-3 De la salida del paquete de software se obtienen los siguientes resultadosa) Y ˆ ϭ Ϫ1275 ϩ 17059 X 1 ϩ 05406 X 2 Ϫ 01743 X 3b) R

2ϭ 872 el modelo explica el 872 de la variacioacuten total en Y

c) Y ˆ ϭ Ϫ1275 ϩ 17059(169) ϩ 05406(10212) Ϫ 01743(26925) ϭ 2436 reembolsos de impuestos

134 Inferencias sobre paraacutemetrosde poblacioacuten

En el capiacutetulo 12 se vio que la recta de regresioacuten de la muestra Y ˆ ϭ a ϩ bX (ecuacioacuten 12-3) esti-maba la recta de regresioacuten de la poblacioacuten Y ϭ A ϩ BX (ecuacioacuten 12-13) La razoacuten por la cual soacute-lo podiacuteamos estimar la recta de regresioacuten de poblacioacuten y no determinarla con exactitud era que los

puntos no caen exactamente en la recta de regresioacuten de la poblacioacuten Debido a las variaciones alea-torias los puntos satisfaciacutean Y ϭ A ϩ BX ϩ e (ecuacioacuten 12-13a) maacutes que a Y ϭ A ϩ BX

En la regresioacuten muacuteltiple se tiene justo la misma situacioacuten Nuestro plano de regresioacuten estimado

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k [13-5]

es una estimacioacuten de un plano de regresioacuten de poblacioacuten verdadero pero desconocido de la forma

Plano de regresioacutende la poblacioacuten

De nuevo los puntos individuales normalmente no caen con exactitud en el plano de regresioacuten depoblacioacuten Consideremos el problema del Servicio Interno de Contribuciones para ver por queacute Notodos los pagos a informantes tendraacuten la misma efectividad Algunas horas en computadora podriacuteanutilizarse para recolectar y organizar datos otras para analizar esos datos en busca de errores y frau-des El eacutexito de la computadora en descubrir impuestos no pagados puede depender de cuaacutento tiempose dedique a cada una de estas actividades Por eacutestas y otras razones algunos de los puntos se en-contraraacuten arriba del plano de regresioacuten y algunos estaraacuten abajo de eacuteste En lugar de satisfacer laecuacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

los puntos individuales satisfaraacuten la ecuacioacuten

Las variaciones alea-torias desplazan lospuntos del plano deregresioacuten

Ecuacioacuten de regresioacuten de la poblacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

Plano de regresioacuten de la poblacioacuten maacutes la variacioacuten aleatoria

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e [13-7a]

La cantidad e que aparece en la ecuacioacuten 13-7a es una variacioacuten aleatoria que en promedio es iguala cero La desviacioacuten estaacutendar de las variaciones individuales e y el error estaacutendar de la estima-cioacuten se que estudiamos en la seccioacuten anterior es una estimacioacuten de e

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1956

Como nuestro plano de regresioacuten de la muestra Y ˆ ϭ a ϩ b1X1 ϩ b2 X 2 ϩ ϩ bk X k (ecuaci13-7) estima el plano de regresioacuten de poblacioacuten desconocido Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk

(ecuacioacuten 13-7) deberemos ser capaces de usarlo para hacer inferencias sobre el plano de regreside la poblacioacuten En esta seccioacuten haremos inferencias acerca de las pendientes ( B1 B2 Bk ) deecuacioacuten de regresioacuten ldquoverdaderardquo (la que se aplica a la poblacioacuten completa) basadas en las pendietes (b1 b2 bk ) de la ecuacioacuten de regresioacuten estimada a partir de la muestra de datos

Inferencias acerca de una pendiente individual B i El plano de regresioacuten se deriva de una muestra y no de la poblacioacuten completa Como resultado

podemos esperar que la ecuacioacuten de regresioacuten verdadera Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k que se aplica a la poblacioacuten completa) sea exactamente igual que la ecuacioacuten estimada a partir observaciones de la muestra Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k Sin embargo podemos utilizarvalor de bi una de las pendientes que calculamos a partir de la muestra para probar hipoacutetesis acca del valor de Bi una de las pendientes del plano de regresioacuten para la poblacioacuten completa

El procedimiento para probar una hipoacutetesis respecto a Bi es parecido al procedimiento analizaen los capiacutetulos 8 y 9 sobre pruebas de hipoacutetesis Para entender este proceso regresemos al probma que relaciona los impuestos no pagados descubiertos con las horas de trabajo en auditoriacuteas campo horas en computadora y recompensas a informantes En la paacutegina 729 sentildealamos que b10597 El primer paso consiste en encontrar un valor para B1 y compararlo con b1 ϭ 0597

Suponga que durante un periodo largo la pendiente de la relacioacuten entre Y y X 1 fue 0400 Paprobar si todaviacutea es vaacutelida podriacuteamos definir las hipoacutetesis como

H0 B1 ϭ 0400 larr Hipoacutetesis nula

H1 B1 0400 larr Hipoacutetesis alternativa

De hecho realizamos la prueba para saber si los datos actuales indican que B1 ha cambiado su vahistoacuterico de 0400

Para encontrar el estadiacutestico de prueba para B1 es necesario hallar primero el error estaacutendar d

coeficiente de regresioacuten El coeficiente de regresioacuten con el que estamos trabajando es b1 de moque el error estaacutendar de este coeficiente se representa con sb1

Resulta demasiado difiacutecil calcular sb1 a mano pero por fortuna Minitab calcula los errores estaacutedar de todos los coeficientes de regresioacuten Por comodidad repetimos la figura 13-2 Los errores taacutendar de los coeficientes se dan en la columna DesvEst de la salida de Minitab

En el cuadro de salida vemos que sb1

es 00811 (Similarmente si deseamos probar una hipoacutesis acerca de B2 vemos que el error estaacutendar apropiado que debemos utilizar es sb2 ϭ 00841) Uvez que encontramos sb1 en la salida de Minitab podemos usar la ecuacioacuten 13-8 para estandarizarpendiente de nuestra ecuacioacuten de regresioacuten ajustada

Estandarizacioacutendel coeficiente deregresioacuten

Error estaacutendar delcoeficientede regresioacuten

Prueba de unahipoacutetesis acerca de B i

Diferencia entre la

ecuacioacuten de regre-sioacuten verdadera y unaestimada a partir delas observacionesde la muestra

Coeficiente de regresioacuten estandarizado

t ϭ [13-8bi ndash Bi0ᎏ

sbi

donde

bull biϭ pendiente de la regresioacuten ajustada

bull Bi0 ϭ pendiente real hipoteacutetica para la poblacioacutenbull sbi ϭ error estaacutendar del coeficiente de regresioacuten

iquestPor queacute utilizamos t para denotar el estadiacutestico estandarizado Recuerde que en la regresioacuten siple utilizamos a y b en la ecuacioacuten 12-7 para calcular se y que se estimaba e la desviacioacuten estaacutedar de las variaciones de los datos (ecuacioacuten 12-13a) Entonces utilizamos se en la ecuacioacuten 12-para encontrar sb el error estaacutendar del coeficiente de regresioacuten que corresponde a la pendiente E

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2056

pezamos con n puntos y los usamos para estimar los dos coeficientes a y b Luego basamtras pruebas en la distribucioacuten t con n Ϫ 2 grados de libertad

De manera similar en la regresioacuten muacuteltiple tambieacuten empezamos con n puntos pero lospara estimar k ϩ 1 coeficientes la ordenada a y k pendientes b1 b2 bk Despueacutes estcientes se usan en la ecuacioacuten 13-6 para calcular se que de nuevo es una estimacioacuten de eviacioacuten estaacutendar de las variaciones de los datos (ecuacioacuten 13-7a) Luego se utiliza se (en ucioacuten que estaacute maacutes allaacute del alcance de este libro) para encontrar s

bi Debido a lo anterior

nuestras pruebas de hipoacutetesis en la distribucioacuten t con n Ϫ k Ϫ 1 (ϭ n Ϫ ( k ϩ l)) grados de En nuestro ejemplo el valor estandarizado del coeficiente de regresioacuten es

t ϭ

ϭ

ϭ 2432 larr Coeficiente de regresioacuten estandarizado

Suponga que estamos interesados en probar nuestras hipoacutetesis al nivel de significancia

Como tenemos 10 observaciones en la muestra y tres variables independientes sabemos n Ϫ k Ϫ 1 o 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad Buscamos en la tabla 2 del apeacutendice en lana de 10 y el rengloacuten de 6 grados de libertad Ahiacute vemos que el valor apropiado de t es 19mo nos preocupa si b1 (la pendiente del plano de regresioacuten de la muestra) es significativamferente de B1 (la pendiente hipoteacutetica del plano de regresioacuten de la poblacioacuten) eacutesta es una pdos colas y los valores criacuteticos son Ϯ1943 El coeficiente de regresioacuten estandarizado es 2se encuentra fuera de la regioacuten de aceptacioacuten de nuestra prueba de hipoacutetesis Por consiguichazamos la hipoacutetesis nula de que B1 todaviacutea es igual a 0400 En otras palabras existe unacia suficientemente grande entre b1 y 0400 para concluir que B1 ha cambiado respecto a histoacuterico Por esto sentimos que cada 100 horas adicionales de trabajo en auditoriacuteas de camaumentan la cantidad de descubrimientos de impuestos no pagados en $400000 como lo hel pasado

Ademaacutes de la prueba de hipoacutetesis podemos construir un intervalo de confianza para cude los valores de Bi Del mismo modo que bi es una estimacioacuten puntual de Bi estos intervalofianza son estimaciones de intervalo de Bi Para ilustrar el proceso de construccioacuten de interconfianza encontremos un intervalo de confianza del 95 para B3 en el ejemplo del IRS Lrelevantes son

b3 ϭ 0405 de la figura 13-2sb3 ϭ 00422

t ϭ 2447 larr Nivel de significancia del 5 y 6 grados de libertad

Intervalo deconfianza para B i

Realizacioacuten de la

prueba de hipoacutetesis

0597 ndash 0400ᎏᎏ

0081

b1 ndash B10ᎏ

sb1

Anaacute l i s i s de r e gr e s i oacutenLa ec uaci oacuten de r egr es i oacuten esDESCUBRE = - 45 0 + 0 597 AUDI TORIacute A + 1 18 COMPUTADORA + 0 405 RECOMPENSA

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 45 796 4 878 - 9 39 0 000AUDI TORIacute A 0 50697 0 08112 7 36 0 000COMPUTADORA 1 17684 0 08407 14 00 0 000RECOMPENSAS 0 40511 0 04223 9 59 0 000

s = 0 2861 R- s q = 98 3

FIGURA 13-2

Salida de Minitab(figura repetida)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2156

Con esta informacioacuten podemos calcular el intervalo de confianza de la siguiente manera

b3 ϩ t (sb3) ϭ 0405 ϩ 2447(00422)

ϭ 0508 larr Liacutemite superior

b3 Ϫ t (sb3) ϭ 0405 Ϫ 2447(00422)

ϭ 0302 larr Liacutemite inferior

Vemos que podemos tener una seguridad del 95 de que cada $1000 adicionales pagados a los formantes aumenta el descubrimiento de impuestos no pagados en una cantidad entre $302000$508000

A menudo estaremos interesados en preguntas del tipo iquesten realidad Y depende de X i Por ejeplo podriacuteamos preguntar si descubrir impuestos no pagados en realidad depende de las horas encomputadora Con frecuencia esta pregunta se plantea como iquestes X i una variable explicativa sigficativa de Y Si piensa un poco maacutes se convenceraacute de que si Bi 0 Y depende de las X i (esto esvariacutea cuando X i variacutea) y no depende de X i si Bi ϭ 0

Vemos que nuestra pregunta conduce a establecer hipoacutetesis de la forma

H0 Bi ϭ 0 larr Hipoacutetesis nula X i no es una variable explicativa significativa

H1 Bi 0 larr Hipoacutetesis alternativa X i es una variable explicativa significativa

Podemos probar estas hipoacutetesis utilizando la ecuacioacuten 13-8 del mismo modo que cuando probamnuestras hipoacutetesis acerca de si B1 todaviacutea era igual a 0400 Sin embargo existe una forma maacutes faacutede hacerlo usando la columna de la figura 13-2 de ldquocociente- t rdquo Observemos de nuevo la ecuaci13-8

t ϭ [13-

Como nuestro valor hipoteacutetico de Bi es cero el valor estandarizado del coeficiente de regresioacutedenotado por t o se convierte en

t o ϭ

El valor de t o se conoce como valor t ldquocalculadordquo Eacuteste es el nuacutemero que aparece en la columna equetada como ldquocociente-t rdquo en la figura 13-2 Denotemos por t c el valor t ldquocriacuteticordquo que buscamos

la tabla 2 del apeacutendice Entonces como la prueba para determinar si X i es una variable explicatisignificativa es una prueba de dos colas soacutelo necesitamos verificar si Ϫt c Յ t o Յ t c

Uso de valores t

calculados en lasalida de Minitab

biᎏ

sbi

bi ndash Bi0ᎏ

sbi

iquestEs significativa unavariable explicativa

Prueba para determinar si una variable es o no significativa

Ϫt c Յ t o Յ t c [13-9

donde

bull t c ϭ valor t adecuado (con n Ϫ k Ϫ 1 grados de libertad) para el nivel de significancia deprueba

bull t o ϭ bi sbi ϭ valor t observado (o calculado) obtenido con el paquete de software

Si t o

cae entre Ϫt c

y t c aceptamos H0 y llegamos a la conclusioacuten de que X

ino es una variable exp

cativa significativa En cualquier otro caso rechazamos H0 y concluimos que X i es una variable eplicativa significativa

Probemos al nivel de significancia de 001 si las horas en computadora constituyen una variabexplicativa significativa para los impuestos no pagados descubiertos De la tabla 2 del apeacutendice cn Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad y ϭ 001 vemos que t c ϭ 3707 De la figura 13tenemos que t o = 1400 Como t o Ͼ t c concluimos que el tiempo en computadora es una variab

Prueba de lasignificancia de lavariable horas decomputadora en elproblema del IRS

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2256

explicativa significativa De hecho al observar los valores t calculados para las otras dos vindependientes (tiempo de auditoriacuteas de campo t o ϭ 736 y recompensa a informantes t ovemos que tambieacuten son variables explicativas significativas

Podemos tambieacuten utilizar la columna de ldquoprdquo para probar si X i es una variable explicativacativa De hecho utilizando esa informacioacuten ni siquiera necesitamos usar la tabla 2 del aLos elementos de esta columna son los valores prob para las hipoacutetesis

H0 Biϭ 0

H1 Bi 0

Recuerde del anaacutelisis hecho en el capiacutetulo 9 que estos valores prob constituyen la probabque cada bi esteacute tan lejos de cero como (o maacutes) el valor observado obtenido de la regresioacutenverdadera Como se ilustra en la figura 13-3 solamente necesitamos comparar estos valocon el nivel de significancia de la prueba para determinar si X i es o no una variable expsignificativa para Y

Probar la significancia de una variable explicativa es siempre una prueba de dos colas Lble independiente X i es una variable explicativa significativa si bi es significativamente dife

cero es decir si t o es un nuacutemero grande positivo o negativoPara el ejemplo del IRS repetimos las pruebas con ϭ 001 Para cada una de las tres v

independientes p es menor que 001 de forma que podemos concluir que cada una de ellanificativa

Inferencias acerca de la regresioacuten como un todo

(usando una prueba F )

Suponga que cubre con papel un tablero para dardos y lanza varios dardos sobre eacutel Despueacuteberlo hecho tendraacute algo muy parecido a un diagrama de dispersioacuten Suponga entonces quuna recta de regresioacuten a este conjunto de ldquopuntos observadosrdquo y calcula r

2 Debido a que lofueron lanzados aleatoriamente usted espera obtener un valor bajo de r

2 puesto que en esten realidad no explica a Y Sin embargo si hace esto muchas veces ocasionalmente observalor alto de r

2 por pura casualidadDada cualquier regresioacuten simple (o muacuteltiple) es natural preguntarse si el valor de r2 (

realmente indica que las variables independientes explican a Y o si esto sucede por cas

A menudo esta interrogante se plantea de la siguiente manera iquestla regresioacuten como un todo ficativa En la uacuteltima seccioacuten vimos coacutemo decidir si una X i individual es una variable exp

Significancia de laregresioacuten comoun todo

FIGURA 13-3

Uso de ldquoprdquo paradeterminar si X i esuna variable expli-cativa significativa

Regioacuten de aceptacioacuten Regioacuten de aceptacioacuten

2 del aacuterea

2 del aacuterea

2 del aacuterea

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

ndasht c

ndasht o

t o

t c

0

(a) p es mayor que X

i no es una variable

explicativa significativa

(b) p es menor que X

i es una variable

explicativa significativa

ndasht o

ndasht c

t c

0

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2356

significativa ahora veremos coacutemo decidir si todas las X i tomadas en conjunto explican significavamente la variabilidad observada de Y Nuestras hipoacutetesis son

H0 B1 ϭ B2 ϭ ϭ Bk ϭ 0 larr Hipoacutetesis nula Y no depende de las X i

H1 por lo menos una Bi 0 larr Hipoacutetesis alternativa Y depende de al menos una de las X i

Cuando analizamos r 2 en el capiacutetulo 12 consideramos la variacioacuten total en Y sum(Y Ϫ Y ෆ )2 la p

te de dicha variacioacuten que explica la regresioacuten sum(Y ˆ Ϫ Y ෆ )2 y la parte no explicada de la variacioacutensum(Y Ϫ Y ˆ )2 La figura 13-4 es un duplicado de la figura 12-15 Sirve como repaso de la relacioacuten etre la desviacioacuten total la desviacioacuten explicada y la desviacioacuten no explicada para un solo dato en uregresioacuten simple Aunque no podamos dibujar una figura similar para una regresioacuten muacuteltiple coceptualmente estamos haciendo lo mismo

Al analizar la variacioacuten en Y fijamos nuestra atencioacuten en tres teacuterminos diferentes cada uno de cuales es una suma de cuadrados Los denotamos con

Suma de cuadradosy sus grados delibertad

Anaacutelisis de lavariacioacuten de losvalores Y

FIGURA 13-4

Desviacioacuten totaldesviacioacutenexplicada ydesviacioacuten noexplicada paraun valor observadode Y

Y

X

Un valor observado de lavariable dependiente (Y )

R e c t a d

e r e g r e s

i oacute n

Desviacioacuten no explicada de esta Y respectoa su media Y

(Y ndash Y )^

Desviacioacuten explicada deesta Y respecto a su media Y

(Y ndash Y )^Y

Valor estimado de esta Y

a partir de la recta de regresioacuten (Y )^

Desviacioacuten total de esta Y

respecto a su media Y

(Y ndash Y )

Tres sumas de cuadrados

SCT ϭ suma de cuadrados total (es decir la parte explicada) ϭ sum(Y Ϫ Y ෆ )2

SCR ϭ suma de cuadrados de la regresioacuten (es decir la parte explicada) ϭ sum(Y ˆ Ϫ Y ෆ )2 [13-10

SCE ϭ suma de cuadrados del error (es decir la parte no explicada) ϭ sum(Y Ϫ Y ˆ )2

Estaacuten relacionadas por la ecuacioacuten

que dice que la variacioacuten total en Y puede dividirse en dos partes la parte explicada y la no explicaCada una de estas sumas de cuadrados tiene un nuacutemero asociado de grados de libertad SCT t

ne n Ϫ 1 grados de libertad (n observaciones menos un grado de libertad debido a que la media la muestra estaacute fija) SCR tiene k grados de libertad porque existen k variables independientes qse utilizaron para explicar Y Finalmente SCE tiene n Ϫ k Ϫ 1 grados de libertad porque utilizamnuestras n observaciones para estimar k ϩ 1 constantes a b1 b2 bk Si la hipoacutetesis nula es ci

ta el cociente

Descomposicioacuten de la variacioacuten total de Y

SCT ϭ SCR ϩ SCE [13-1

Cociente F

F ϭ [13-12SCR k ᎏᎏ

SCE(n ndash k ndash 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2456

tiene una distribucioacuten F con k grados de libertad en el numerador y n Ϫ k Ϫ 1 grados de libel denominador Si la hipoacutetesis nula es falsa entonces el cociente tiende a ser maacutes grande qula hipoacutetesis nula es verdadera De modo que si el cociente F es demasiado grande (seguacuten lo na el nivel de significancia de la prueba y el valor apropiado de la tabla 6 del apeacutendice) rechH0 y concluimos que la regresioacuten como un todo es significativa

La figura 13-5 presenta la salida de Minitab para el problema del IRS Esta parte del rincluye los cocientes F calculados para la regresioacuten en ocasiones llamado anaacutelisis de v

(ANOVA) para la regresioacuten Probablemente se pregunte si esto tiene algo que ver con el anaacutelisrianza que estudiamos en el capiacutetulo 11 La respuesta es siacute Aunque no lo hicimos es posibletrar que el anaacutelisis de varianza visto en el capiacutetulo 11 tambieacuten contempla la variacioacuten total las observaciones alrededor de la gran media y la divide en dos partes una explicada por lascias entre los distintos grupos (que corresponde a lo que llamamos varianza entre columnas)

no explicada por dichas diferencias (que corresponde a la varianza dentro de columnas) Estcisamente anaacutelogo a lo que acabamos de hacer en la ecuacioacuten 13-11Para el problema del IRS vemos que SCR ϭ 29109 (con k ϭ 3 grados de libertad) SCE

(con n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad) y que

F ϭ ϭ ϭ 11833

Los elementos en la columna ldquoMCrdquo son justo las sumas de cuadrados divididas entre sus glibertad Para 3 grados de libertad en el numerador y 6 en el denominador la tabla 6 del apeacutence que 978 es el liacutemite superior de la regioacuten de aceptacioacuten para un nivel de significancia El valor calculado de F 11833 estaacute muy por arriba de 978 de manera que se ve que la r

como un todo es altamente significativa Se puede llegar a la misma conclusioacuten si se observresultado del programa dice que ldquo prdquo es 0000 Debido a que este valor prob es menor que elsignificancia ϭ 001 se concluye que la regresioacuten completa es significativa De esta mapuede usar la p de ANOVA como prueba sin tener que utilizar la tabla 6 del apeacutendice para bvalor criacutetico de F Esto es anaacutelogo a la manera en que se usaron los valores de p en la figura ra probar la significancia de las variables explicativas individuales

Multicolinealidad en la regresioacuten muacuteltiple

En el anaacutelisis de regresioacuten muacuteltiple los coeficientes de regresioacuten a menudo se vuelven

confiables conforme aumenta el grado de correlacioacuten entre las variables independie

existe un alto nivel de correlacioacuten entre algunas de las variables independientes nos enfrenun problema que los estadiacutesticos llaman multicolinealidad

La multicolinealidad puede presentarse si deseamos estimar la recuperacioacuten de las ventaempresa y utilizamos tanto el nuacutemero de vendedores empleados como sus salarios totales Cvalores asociados con estas dos variables independientes tienen una correlacioacuten alta neceusar soacutelo un conjunto de ellos para realizar nuestra estimacioacuten De hecho al agregar una segriable que estaacute correlacionada con la primera se distorsionan los valores de los coeficientgresioacuten Sin embargo a menudo podemos predecir bien Y incluso cuando haya multicoline

Consideremos un ejemplo donde existe multicolinealidad para ver coacutemo afecta a la regresrante los 12 meses pasados el gerente del restaurante Pizza Shack ha estado poniendo unaanuncios en el perioacutedico local Los anuncios se programan y pagan el mes anterior a que ap

Un ejemplo demulticolinealidad

Definicioacuten y efecto dela multicolinealidad

9703ᎏ

0082

29109 3ᎏ

0491 6Prueba de lasignificancia de laregresioacuten en elproblema del Serviciode Contribuciones

Anaacutelisis devarianza parala regresioacuten

Prueba F de laregresioacuten como

un todo

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 29 1088 9 7029 118 52 0Er r or 6 0 4912 0 0819Tot al 9 29 6000

FIGURA 13-5Salida de Minitabanaacutelisis devarianza

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2556

Cada anuncio contiene un cupoacuten que permite llevarse dos pizzas pagando solamente la de mcio El gerente recolectoacute los datos de la tabla 13-4 y le gustariacutea utilizarlos para predecir las vpizzas

En las figuras 13-6 y 13-7 se dieron los resultados de Minitab para las regresiones respelas ventas totales sobre el nuacutemero de anuncios y sobre el costo

Para la regresioacuten sobre el nuacutemero de anuncios tenemos que el valor t observado es 395grados de libertad y un nivel de significancia de ϭ 001 se encontroacute que el valor t criacuteticdo de la tabla 2 del apeacutendice) es 3169 Como t o Ͼ t c (o de manera equivalente como p es m001) concluimos que el nuacutemero de anuncios es una variable explicativa altamente signifilas ventas totales Note tambieacuten que r 2 ϭ 610 de modo que el nuacutemero de anuncios explximadamente el 61 de la variacioacuten en las ventas de pizzas

Para la regresioacuten sobre el costo de los anuncios el valor t observado es 454 de modo qude los anuncios es una variable explicativa de las ventas totales todaviacutea maacutes significativa que ro de anuncios (para los que el valor t observado fue soacutelo 395) En esta regresioacuten r 2 ϭ 673

el costo de los anuncios explica aproximadamente el 67 de la variacioacuten de las ventas de pizComo ambas variables explicativas son altamente significativas por siacute mismas intentam

zar ambas en una regresioacuten muacuteltiple El resultado se presenta en la figura 13-8La regresioacuten muacuteltiple es altamente significativa como un todo ya que la p de ANOVA e

Uso de ambas varia-bles explicativas enuna regresioacuten muacuteltiple

Dos regresionessimples

Datos de ventas y anun-cios para el restaurantePizza Shack

Tabla 13-4 X 1 X 2 Y

Nuacutemero Costo de anuncios Venta tode anuncios publicados de pizz

Mes publicados (cientos de doacutelares) (miles de d

Mayo 12 139 436

Junio 11 120 380

Julio 9 93 301

Agosto 7 97 353

Septiembre 12 123 464

Octubre 8 114 342

Noviembre 6 93 302

Diciembre 13 143 407

Enero 8 102 385

Febrero 6 84 226

Marzo 8 112 376

Abril 10 111 352

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esVENTAS = 16 9 + 2 08 ANUNCI OS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 16 937 4 982 3 40 0 007ANUNCI OS 2 0832 0 5271 3 95 0 003

s = 4 206 R- s q = 61 0

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 1 276 31 276 31 15 62 Er r or 10 176 88 17 69Tot a l 11 453 19

Figura 13-6

Regresioacuten de lasventas sobre elnuacutemero deanuncios conMinitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2656

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2756

gar el nuacutemero de anuncios como segunda variable explicativa ademaacutes del costo de los anuncios eplica nada maacutes alrededor del 1 adicional de la variacioacuten de las ventas totales

En este punto es justo preguntarse iquestqueacute variable realmente explica la variacioacuten de las ventotales en la regresioacuten muacuteltiple La respuesta es que ambas la explican pero no podemos separ

sus contribuciones individuales debido a que estaacuten altamente correlacionadas entre siacute E

consecuencia sus coeficientes en la regresioacuten muacuteltiple tienen errores estaacutendar altos valore

calculados relativamente bajos y valores prob Ͼ | t | relativamente altos

iquestDe queacute manera nos afecta esta multicolinealidad Todaviacutea podemos hacer predicciones relativmente precisas cuando se encuentra presente note que para la regresioacuten muacuteltiple (la salida se dala figura 13-8) el error estaacutendar de la estimacioacuten que determina el ancho de los intervalos de co

fianza para las predicciones es 3989 mientras que para la regresioacuten simple con el costo de los anucios como variable explicativa (salida en la figura 13-7) tenemos se ϭ 3849 Lo que no podemhacer es predecir con mucha precisioacuten coacutemo cambiaraacuten las ventas si aumentamos en uno el nuacutemede anuncios La regresioacuten muacuteltiple dice que b1 ϭ 0625 (esto es cada anuncio aumenta las ventotales de pizzas alrededor de $625) pero el error estaacutendar de este coeficiente es 112 (es decir apximadamente $1120)

Las contribucionesindividuales nopueden separarse

Ejercicios 134

Ejercicios de autoevaluacioacuten

EA 13-4 Edith Pratt es una ocupada ejecutiva de una compantildeiacutea de transporte de carga a nivel nacional y va tara una junta porque no encuentra la salida de la regresioacuten muacuteltiple elaborada por un asistente Si la regsioacuten total es significativa al nivel 005 ella desea usar las salida de computadora como evidencia para fudamentar algunas ideas que expondraacute en la reunioacuten Sin embargo su ayudante estaacute enfermo De hectoda la informacioacuten que tiene de la regresioacuten muacuteltiple es un trozo de papel con los siguientes datos

Regresioacuten paraEdith Pratt

SCR 8724 con gl

SCE con 17 gl

SCT 10236 con 24 gl

Como el papel ni siquiera tiene todos los nuacutemeros Edith ha concluido que no es uacutetil Usted sin embardebe saber maacutes que ella iquestPuede Edith entrar en la junta o debe seguir buscando la salida de computador

EA 13-5 Una pequentildea liacutenea aeacuterea de Nueva Inglaterra realizoacute una encuesta sobre sus 15 terminales y obtuvo losguientes datos para el mes de febrero donde

VENTAS ϭ ingreso total seguacuten el nuacutemero de boletos vendidos (en miles de doacutelares)

PROMOCϭ cantidad gastada en promociones de la liacutenea aeacuterea en el aacuterea (en miles de doacutelares)

COMPET ϭ nuacutemero de liacuteneas aeacutereas que compiten en esa terminal

GRATIS ϭ nuacutemero de pasajeros que vuelan gratis (por diferentes razones)

Sugerencia el concepto de hacer infe-rencias respecto a una regresioacuten muacutelti-ple es justo lo mismo que se hizo en elcapiacutetulo 12 cuando hicimos inferencias

respecto a una recta de regresioacuten excepto que ahora se em-

plean dos o maacutes variables independientes Advertencia lamulticolinealidad es un problema que debe manejarse enla regresioacuten muacuteltiple y es necesario desarrollar una com-prensioacuten con sentido comuacuten Recuerde que todaviacutea puedehacer predicciones precisas cuando estaacute presente Pero re-cuerde tambieacuten que no puede decir con mucha precisioacuten

cuaacutento cambiaraacute la variable dependiente si ldquomanipulardquo lavariables independientes Entonces el objetivo debe seminimizar la multicolinealidad Sugerencia la mejor regresioacuten muacuteltiple es la que explica la relacioacuten entre los datos asentildealar la responsabilidad de la mayor proporcioacuten de la va

riacioacuten en la variable dependiente con el menor nuacutemero dvariables independientes Advertencia no es una buenidea incluir demasiadas variables independientes soacutelo porque cuenta con una computadora y un paquete de softwarpara estadiacutestica

SUGERENCIAS

Y

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2856

Ventas (doacutelares) Promoc (doacutelares) Compet Gratis

793 25 10 3

2001 55 8 6

1632 60 12 9

2001 79 7 16

1460 52 8 15

1777 76 12 9

309 20 12 8

2919 90 5 10

1600 40 8 43394 96 5 16

1596 55 11 7

863 30 12 6

2375 60 6 10

1072 50 10 4

1550 35 10 4

a) Utilice la siguiente salida de Minitab para determinar la ecuacioacuten de regresioacuten que mejor se ara la liacutenea aeacuterea

La ec uaci oacuten de r egr es i oacuten esVENTAS ϭ 172 ϩ 25 9 PROMOVϪ 13 2 COMPET Ϫ 3 04 GRATI S

Pr onos t i cador Coef Des vEs t Coci ent e - t Cons t ant e 172 34 51 38 3 35 0PROMOV 25 950 4 877 5 32 0COMPET - 13 238 3 686 - 3 59 0GRATI S - 3 041 2 342 - 1 30 0

b) iquestLos pasajeros que vuelan gratis ocasionan una disminucioacuten significativa en las ventas Fpruebe las hipoacutetesis apropiadas Use ϭ 005

c) iquestUn incremento de $1000 en las promociones cambia las ventas en $28000 o el cambio ecativamente diferente de $28000 Formule y pruebe las hipoacutetesis adecuadas Use ϭ 010

d) Calcule un intervalo de confianza del 90 para el coeficiente de la pendiente de la COMPET

Aplicaciones

13-22 Mark Lowtown publica el perioacutedico Mosquito Junction Enquirer y tiene problemas para predectidad de papel perioacutedico que necesita imprimir diariamente Eligioacute aleatoriamente 27 diacuteas del arior y registroacute la siguiente informacioacuten

PESO ϭ peso en libras de papel perioacutedico para la edicioacuten de ese diacutea

CLASIFICADOS ϭ nuacutemero de anuncios clasificados

PUBLICIDAD ϭ nuacutemero de anuncios publicitarios

PLANA COMPLETA ϭ nuacutemero de anuncios a una plana

Utilizando Minitab para hacer una regresioacuten de PESO sobre las otras tres variables Mark obtuguiente salida

Pr onos t i cador Coef Des vEs t Coci ent e- t Cons t ant e 1072 95 872 43 1 23 0CLASI FI CADOS 0 251 0 126 1 99 0PUBLI CI DAD 1 250 0 884 1 41 0PLANA COMPLETA 250 66 67 92 3 69 0

a) Mark siempre ha pensado que cada anuncio publicitario utiliza al menos 3 libras de papel iquestsioacuten le da una razoacuten significativa para dudar esto al nivel del 5

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2956

b) De manera similar Mark siempre ha creiacutedo que cada anuncio clasificado utiliza aproximmedia libra de papel iquestTiene ahora Mark una razoacuten significativa para dudar esto al nivel del

c) Mark vende espacios de anuncios de plana completa a los comerciantes locales a $30 la paacutegberaacute pensar en ajustar sus tarifas si el papel perioacutedico le cuesta $009 por libra Suponga costos son despreciables Establezca expliacutecitamente las hipoacutetesis y una conclusioacuten (Sugere

jando todo lo demaacutes constante cada anuncio adicional de plana completa tiene un costo de bras de papel ϫ $009 por libra ϭ $2256 El punto de equilibrio es 333333 libras iquestPor quel coeficiente de pendiente para PLANA COMPLETA es significativamente mayor que Mark no estaacute obteniendo ganancias y debe cambiar sus tarifas)

13-23 Para los datos del ejercicio 13-18 y un nivel de significancia de 010 iquestcuaacuteles variables son sign

mente explicativas de los resultados de los exaacutemenes (Habiacutea 12 estudiantes en la muestra) 13-24 Para los datos del ejercicio 13-18 y la siguiente salida de Minitab del procedimiento de regresiple hecho por Bill

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 3134 42 783 60Er r or 7 951 25 135 89Tot a l 11 4085 67

a) iquestCuaacutel es el valor observado de F b) A un nivel de significancia de 005 iquestcuaacutel es el valor criacutetico de F que se debe utilizar para d

si la regresioacuten como un todo es significativac) Basaacutendose en las respuestas a los incisos a) y b) iquestes la regresioacuten significativa como un tod

13-25 Remiacutetase al ejercicio 13-19 A un nivel de significancia de 001 iquestes la variable DISTANCIA uble explicativa significativa para VENTAS

13-26 Para los datos del ejercicio 13-19 y la siguiente salida adicional de Minitab al correr la regresioacuten

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 2861495 715374 102 39 0Er r or 18 125761 6896 7Tot a l 22 2987256

Al nivel de significancia de 005 iquestes la regresioacuten significativa como un todo

13-27 Henry Lander es el director de produccioacuten de la Alecos Corporation de Caracas Venezuela Hede que le ayude a determinar una foacutermula para predecir el ausentismo de los empacadores de chipoacutetesis es que la temperatura diaria promedio puede explicar el porcentaje de ausentismo Durios meses reuacutene datos ejecuta el procedimiento de regresioacuten simple y encuentra que la tempeplica 66 de la variacioacuten en el ausentismo Pero Henry no estaacute convencido de que eacuteste sea un cador satisfactorio Sugiere que la precipitacioacuten pluvial diaria podriacutea tambieacuten tener algo que vausentismo de modo que registra los datos correspondientes y hace una regresioacuten del ausentismte el tiempo de lluvias y obtiene un valor R2 de 059 ldquoiexclEurekardquo grita usted ldquoiexclLo tengo Con uticador que explica 66 y otro que explica 59 todo lo que tengo que hacer es una regresioacutenutilizando ambos y seguramente tendreacute un pronosticador casi perfectordquo Para su desaacutenimo sin la regresioacuten muacuteltiple tiene una R

2 de soacutelo 68 que es solamente un poco mejor que la variablperatura sola iquestCoacutemo puede explicar esta aparente discrepancia

13-28 Juan Armenlegg administrador de Rockyrsquos Diamond y Jewelry Store estaacute interesado en desamodelo para estimar la demanda del consumidor para su costosa mercanciacutea Como la mayoriacutea de

tes compran diamantes y joyas a creacutedito Juan estaacute seguro de que dos factores que deben influirmanda de los clientes son la tasa real de inflacioacuten anual y la tasa real de intereses sobre preacutestamprincipales bancos del paiacutes Explique algunos problemas que Juan podriacutea encontrar si fuera a dun modelo de regresioacuten basado en estas dos variables de prediccioacuten

13-29 Un nuevo programa de juegos Check That Model pide a los concursantes que especifiquen el nuacutenimo de paraacutemetros que necesitan para determinar si un modelo de regresioacuten muacuteltiple es signifimo un todo para ϭ 001 Usted ganoacute la apuesta con 4 paraacutemetros Use la siguiente informacioacutenterminar si la regresioacuten es significativa

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3056

R 2

ϭ 07452

SCE ϭ 1254

n ϭ 18

Nuacutemero de variables independientes ϭ 3

13-30 La Scottish Turist Agency estaacute interesada en el nuacutemero de turistas que entran al paiacutes cada semanrante la temporada alta Se recolectaron los siguientes datos

Turistas (Y ) ϭ nuacutemero de turistas que entran a Escocia en una semana (en miles)

Cambio (X 1)ϭ nuacutemero de libras escocesas compradas por $1 doacutelar

Precio (X 2) ϭ nuacutemero de libras escocesas cobradas por viaje redondo en camioacuten de Londres a Edimburgo

Promoc (X 3) ϭ cantidad gastada en promocioacuten del paiacutes (en miles de libras escocesas)Temp (X 4) ϭ temperatura media durante la semana en Edimburgo (en grados Celsius)

Turistas (Y ) Cambio (X 1) Precio (X 2) Promoc (X 3) Temp (X 4)

69 061 40 87 154

71 059 40 88 156

68 063 40 85 154

79 061 35 86 153

76 060 35 94 158

82 065 35 99 162

80 058 35 98 164

84 059 35 102 166

97 061 30 114 174

98 062 30 116 172

72 057 40 84 176

67 055 40 86 164

a) Utilice el paquete de software que tenga para determinar la ecuacioacuten de regresioacuten que mejote a los datos de la agencia de turismo

b) iquestEs la tasa de cambio una variable explicativa significativa Establezca y pruebe las hipoacutetesidas a un nivel de significancia de 010

c) Un incremento de 1000 libras en las promociones iquestaumenta el nuacutemero de turistas en maacutesEstablezca y pruebe las hipoacutetesis adecuadas para un nivel de significancia de 005

d) Calcule un intervalo de confianza del 95 para el coeficiente de la pendiente de Temp

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-4 Como SCT ϭ SCR ϩ SCE SCE ϭ SCT Ϫ SCR ϭ 10236 Ϫ 8724 ϭ 1512Como gl SCT ϭ gl SCR ϩ gl SCE gl SCR ϭ gl SCT Ϫ gl SCE ϭ 24 Ϫ 17 ϭ 7

Entonces F ϭ ϭ ϭ 1401

F CRiacuteT ϭ F (7 17 005) ϭ 261Como F OBS gt F CRIacuteT se concluye que la regresioacuten es significativa como un todo Edith debe conticando la salida de computadora de la regresioacuten para usarla en la junta

EA 13-5 De la salida de computadora se obti enen los siguientes resultadosa) VENTAS ϭ 17234 ϩ 25950PROMOC Ϫ13238COMPET Ϫ 3041GRATISb) H0 BGRATIS ϭ 0 H1 BGRATIS Ͻ 0 ϭ 005

Eacutesta es una prueba de una cola y el valor prob en los resultados es para la alternativa de dos c BGRATIS 0 De manera que para esta prueba el valor prob es 02212 ϭ 0111 Ͼ ϭ 00que no se puede rechazar H0 las ventas no disminuyen significativamente cuando aumenta ro de pasajeros que vuelan gratis

c) H0 BPROMOC ϭ 28 H1 BPROMOC 28 ϭ 010

87247ᎏᎏ

151217SCRk ᎏᎏ

SCE(n Ϫ k Ϫ 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3156

El valor observado t de los resultados de regresioacuten es

ϭ ϭ Ϫ0420

Con 11 grados de libertad y ϭ 010 en ambas colas combinadas los valores criacuteticos t parba son Ϯ1796 asiacute el valor observado estaacute dentro de la regioacuten de aceptacioacuten No se rechacambio en VENTAS para un incremento de una unidad ($1000) en PROMOC no es significate diferente de 28 ($28000)

d) Con 11 grados de libertad el valor t para un intervalo del 90 de confianza es 1796 por lo

tervalo esbCOMP Ϯ 1796sbCOMP

ϭ Ϫ13238 Ϯ 1796(3686)

ϭ Ϫ13238 Ϯ 6620 ϭ (Ϫ19858 Ϫ 6618)

La liacutenea aeacuterea puede tener una seguridad del 90 de que el ingreso por los boletos en una ofminuye entre $6600 y $19900 aproximadamente con cada liacutenea aeacuterea adicional que comp

135 Teacutecnicas de modelado

Dada una variable que deseamos explicar y un conjunto de variables explicativas potencialehaya varias ecuaciones de regresioacuten diferentes que podamos estudiar dependiendo de queacute explicativas incluyamos y de coacutemo lo hagamos Cada una de esas ecuaciones de regresioacutence como modelo Las teacutecnicas de modelado son las distintas formas en que podemos incluriables explicativas y verificar queacute tan apropiados son los modelos de regresioacuten Existen municas de modelado diferentes pero soacutelo veremos dos de las maacutes utilizadas

Datos cualitativos y variables ficticias

En todos los ejemplos de regresioacuten que hemos visto hasta ahora los datos manejados hanmeacutericos o cuantitativos Pero ocasionalmente nos enfrentaremos con una variable categoacuterilitativa En el problema del inicio el capiacutetulo el director de personal desea ver si el salarioun vendedor depende de su sexo En la tabla 13-5 repetimos los datos de dicho problema

Por el momento ignore la antiguumledad y utilice la teacutecnica desarrollada en el capiacutetulo 9 bar la diferencia entre las medias de dos poblaciones para ver si los hombres ganan maacutes qu

jeres Pruebe con ϭ 001 Si tomamos a los hombres como la poblacioacuten 1 y a las mujerespoblacioacuten 2 probaremos las siguientes hipoacutetesis

H0 1 ϭ 2 larr Hipoacutetesis nula no existe discriminacioacuten por sexo en los salarios base

H1 1 Ͼ 2 larr Hipoacutetesis alternativa se discrimina a las mujeres en su salario base

ϭ 001 larr Nivel de significancia

Revisioacuten del enfoqueanterior del problema

Buacutesqueda dediferentes modelos

25950 Ϫ 28ᎏᎏ

4877

(bPROMOC Ϫ 28)ᎏᎏ

sbPROMOC

Datos para el problemade discriminacioacuten porsexo

Tabla 13-5 Vendedores VendedorasAntiguumledad Salario base Antiguumledad Salario base(en meses) (en miles) (en meses) (en miles)

6 75 5 62

10 86 13 87

12 91 15 94

18 103 21 98

30 130

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3256

A continuacioacuten bosquejamos el anaacutelisis Si tiene problemas para seguirlo deberaacute repasamente la seccioacuten 93

n1 ϭ 5 n2 ϭ 4

x ෆ1 ϭ 97 x ෆ2 ϭ 8525

s2

1 ϭ 4415 s2

2 ϭ 2609

s2

p ϭ

ϭ

ϭ 3641

x ෆ1Ϫ x

ෆ2ϭ s pΊ ϩ

ϭ 128

t ϭ

ϭ

ϭ 092

Con siete grados de libertad el valor t criacutetico para una prueba de cola superior con ϭ 001 eComo el valor t observado de 092 es menor que 2998 no podemos rechazar H0

Entonces el anaacutelisis concluye que no parece haber discriminacioacuten por sexo en los salarPero recuerde que hasta ahora se han ignorado los datos de antiguumledad laboral para el anaacuteli

Antes de seguir vea el diagrama de dispersioacuten de los datos En la figura 13-9 los punto

corresponden a los hombres y los blancos a las mujeres El diagrama de dispersioacuten muestraridad que el salario base aumenta con los antildeos de antiguumledad pero si con la mirada sigue lo qla recta de regresioacuten notaraacute que los puntos negros tienden a estar arriba de ella y los blancos

La figura 13-10 da la salida de una regresioacuten del salario base sobre los meses de antiguumlelos resultados se ve que la antiguumledad es una variable explicativa altamente significativa

Ademaacutes r 2

ϭ 926 que indica que la variable meses de antiguumledad explica cerca del 9variacioacuten en el salario base La figura 13-11 contiene parte de la salida que no se vio antesbla de residuos Para cada punto el residuo es simplemente Y Ϫ Y ˆ que se reconoce como el

Una ldquomiradardquo a los

datos

El enfoque anterior nodetecta discriminacioacuten

(97 ndash 8525) ndash 0ᎏᎏ

128

( x ෆ1 ndash x ෆ2) ndash (1 Ϫ 2)H0

ᎏᎏᎏ

ˆ x ෆ1Ϫ

x ෆ2

1ᎏ

n2

1ᎏ

n1

4(4415) ϩ 3(2609)ᎏᎏᎏ5 ϩ 4 ndash 2

(n1 ndash 1)s21 ϩ (n2 ndash 1)s22ᎏᎏᎏ

n1 ϩ n2 ndash 2

FIGURA 13-9

Diagrama de dis-persioacuten de salariosbase contra mesesde antiguumledad

4 8 12 16 20 24 28

4

8

12

Meses de antiguumledad

S a l a r i o ( m i l e s d e d oacute l a r e s )

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3356

el ajuste de la recta de regresioacuten en ese punto En la figura 13-11 AJUST1 son los valores y RESI1 son los residuos

Tal vez la parte maacutes importante del anaacutelisis del resultado de una regresioacuten sea estusiduos Si la regresioacuten incluye todos los factores explicativos relevantes estos residuo

ser aleatorios Dicho de otro modo si los residuos muestran cualquier patroacuten no aleat

to indica que hay algo sistemaacutetico que afecta el proceso y que no hemos tomado en cu

manera que buscamos patrones en los residuos o para decirlo de forma maacutes pintoresca ldquopmos a los residuos hasta hacerlos hablarrdquo

Si observamos los residuos presentados en la figura 13-11 vemos que los primeros cincoson positivos De modo que para los vendedores tenemos Y ndash Y ˆ Ͼ 0 o Y Ͼ Y ˆ es decir laregresioacuten cae abajo de estos cinco puntos Tres de los cuatro uacuteltimos residuos son negaticonsiguiente para las vendedoras tenemos Y Ϫ Y ˆ Ͻ 0 o Y Ͻ Y ˆ asiacute que la recta de regresicuentra arriba de tres de los cuatro puntos Esto confirma lo que vimos al observar el diagdispersioacuten de la figura 13-9 Este patroacuten no aleatorio en los residuos sugiere que el sexo siacute etor determinante del salario base

iquestCoacutemo podemos incorporar el sexo de los vendedores dentro del modelo de regresioacutencemos utilizando un dispositivo llamado variable ficticia (o variable indicadora) Para lpuntos que representan a los vendedores esta variable tiene valor de 0 y para los cuatro purepresentan a las vendedoras valdraacute 1 Los datos de entrada para nuestra regresioacuten con variticias se dan en la tabla 13-6

Para los datos de la tabla 13-6 se ajusta una regresioacuten de la forma

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

Uso de variablesficticias

Deteccioacuten depatrones en losresiduos

ldquoPresionar a losresiduosrdquo

Anaacutel i s i s de r e gr e s i oacuten

La ec uac i oacuten de r e gr es i oacuten esSALARI O ϭ 5 81 ϩ 0 233 MESES

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t pCons t a nt e 5 8093 0 4038 14 39 0 000MESES 0 23320 0 02492 9 36 0 000

s ϭ 0 5494 R- s q ϭ 92 6

Anaacute l i s i s de va r i a nz aFUENTE GL SC MC F Re gr e s i oacuten 1 26 443 24 443 87 61 0Er r or 7 2 113 0 302Tot a l 8 28 556

FIGURA 13-10

Regresioacuten conMinitab del salariobase sobre losmeses deantiguumledad

RENGLOacuteN SALARI O AJ UST1 RESI 1

1 7 5 7 2085 0 2914992 8 6 8 1413 0 458684

3 9 1 8 6077 0 4922764 10 3 10 0069 0 2930545 13 0 12 8054 0 1946076 6 2 6 9753 - 0 7752977 8 7 8 8409 - 0 1409288 9 4 9 3073 0 0926649 9 8 10 7066 - 0 906558

FIGURA 13-11

Tabla de residuosde Minitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 656

tubre alrededor de 4300 horas Pero con el fin de aumentar las detecciones de impuestos no p

el IRS espera aumentar el nuacutemero de horas en computadora a cerca de 1600 Como resultad X 1 ϭ 43 larr 4300 horas de trabajo en auditoriacuteas de campo

X 2 ϭ 16 larr 1600 horas de tiempo en computadora

Sustituyendo estos valores en la ecuacioacuten de regresioacuten para el departamento de auditoriacuteanemos

Y ˆ ϭ Ϫ13828 ϩ 0564 X 1 ϩ 1099 X 2

Y ˆ ϭ Ϫ13828 ϩ (0564)(43) ϩ (1099)(16)

Y ˆ ϭ Ϫ13828 ϩ 24252 ϩ 17584

Y ˆ ϭ 28008 larr Detecciones estimadas de $28008000

Por tanto en el pronoacutestico para noviembre el departamento de auditoriacuteas espera enconevasioacuten de impuestos cercana a 28 millones de doacutelares para esta combinacioacuten de factores

Hasta este punto nos hemos referido a a como la ordenada Y y a b1 y b2 como las pendieplano de regresioacuten muacuteltiple Pero para ser maacutes precisos debemos decir que estas constantericas son los coeficientes de regresioacuten estimados La constante a es el valor de Y ˆ (en este catimacioacuten de los impuestos no pagados) si tanto X 1 como X 2 tienen valor cero Los coeficienb2 describen coacutemo los cambios en X 1 y X 2 afectan el valor de Y ˆ En el ejemplo del IRS pode

jar constante el nuacutemero de horas de trabajo de auditoriacutea de campo X 1 y cambiar el nuacutemerras en computadora X 2 Cuando hacemos esto el valor de Y ˆ aumenta en $1099000 por choras adicionales de tiempo en computadora Del mismo modo podemos fijar X 2 y encon

por cada aumento adicional de 100 horas en el nuacutemero de horas de trabajo de auditoriacuteas deY ˆ aumenta $564000

a b 1 y b 2 son loscoeficientes de re-gresioacuten estimados

Interpretacioacuten de laestimacioacuten

Sugerencia si tiene problemas para vi-sualizar lo que hace en realidad la regre-sioacuten muacuteltiple piense en el capiacutetulo 12 yrecuerde que una recta de regresioacuten des-

cribe la relacioacuten entre dos variables En la regresioacuten muacutelti-ple el plano de regresioacuten como el que se ve en la paacuteginaanterior describe la relacioacuten entre tres variables Y X 1 y X 2El concepto del plano de regresioacuten adecuado es el mismo

que el de la recta de regresioacuten adecuada es decir el qnimiza la suma de los cuadrados de las distancias vles entre los puntos de los datos y el plano en este cavez sea uacutetil recordar que cada variable independienteser responsable de cierta variacioacuten en la variable diente La regresioacuten muacuteltiple es soacutelo una manera dvarias variables independientes para hacer un promejor de la variable dependiente

SUGERENCIAS

Y

SUPOSICIONES

Valores para ajustarel plano de miacutenimoscuadrados donden ϭ 10

Tabla 13-2 Y X 1 X 2 X 1Y X 2Y X 1Y 2 X 2

1 X 2

2

(1) (2) (3) (2) ϫ (1) (3) ϫ (1) (2) ϫ (3) (2)2 (3)2

29 45 16 1305 464 720 2025 256

24 42 14 1008 336 588 1764 196

27 44 15 1188 405 660 1936 225

25 45 13 1125 325 585 2025 169

26 43 13 1118 338 559 1849 169

28 46 14 1288 392 644 2116 196

30 44 16 1320 480 704 1936 256

28 45 16 1260 448 720 2025 256 28 44 15 1232 420 660 1936 225

27 43 15 1161 405 645 1849 225

272 441 147 12005 4013 6485 19461 2173 7uarr uarr uarr uarr uarr uarr uarr uarr

Y X 1 X 2 X 1Y X 2Y X 1X 2 X 21 X 22

Y ෆ ϭ 272

X ෆ1 ϭ 441

X ෆ2 ϭ 147

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 756

Ejercicios 132

Ejercicios de autoevaluacioacutenEA 13-1 Dado el siguiente conjunto de datos

a) Calcule el plano de regresioacuten muacuteltipleb) Prediga Y cuando X 1 ϭ 30 y X 2 ϭ 27

Y X 1 X 2

25 35 50

30 67 4211 15 85

22 03 14

27 46 36

19 20 13

EA 13-2 Se ha reunido la siguiente informacioacuten de una muestra aleatoria de arrendadores de departamentos en uciudad Se intenta predecir la renta (en doacutelares por mes) con base en el tamantildeo del departamento (nuacutemro de habitaciones) y la distancia al centro de la ciudad (en millas)

Renta Nuacutemero de Distancia(doacutelares) habitaciones al centro

360 2 1

1000 6 1450 3 2

525 4 3

350 2 10

300 1 4

a) Calcule la ecuacioacuten de miacutenimos cuadrados que relacione mejor estas tres variablesb) Si alguien busca un departamento de dos habitaciones a 2 millas del centro iquestqueacute renta debe esperar pag

Conceptos baacutesicos 13-7 Dado el siguiente conjunto de datos

a) Calcule el plano de regresioacuten muacuteltipleb) Pronostique Y cuando X 1 ϭ 105 y X 2 ϭ 136

Y X 1 X 2

114 45 132

166 87 187

205 126 198

294 197 254

76 29 228

138 67 178

285 174 146

13-8 Para el siguiente conjunto de datosa) Calcule el plano de regresioacuten muacuteltipleb) Prediga Y cuando X 1 ϭ 28 y X 2 ϭ 10

Y X 1 X 2

10 8 4

17 21 9

18 14 11

26 17 20

35 36 13

8 9 28

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 856

13-9 Dado el siguiente conjunto de datosa) Calcule el plano de regresioacuten muacuteltipleb) Pronostique Y cuando X 1 ϭ Ϫ1 y X 2 ϭ 4

Y X 1 X 2

6 1 3

10 3 Ϫ1

9 2 4

14 Ϫ2 7

7 3 2

5 6 Ϫ4

Aplicaciones

13-10 Sam Spade duentildeo y gerente general de Stationery Store estaacute preocupado por el comportamienventas de un modelo de reproductor de CD y casetes que se venden en la tienda Se da cuenta de ten muchos factores que podriacutean ayudar a explicarlo pero cree que la publicidad y el precio soncipales determinantes Sam reunioacute los siguientes datos

Ventas Publicidad Precio(unidades vend) (nuacutem de anuncios) (doacutelares)

33 3 125

61 6 115

70 10 140

82 13 130

17 9 145

24 6 140

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir las ventas a partir de la publicidad y b) Si la publicidad es 7 y el precio es $132 iquestqueacute ventas podriacutea pronosticar

13-11 Un productor de comida para cerdos desea determinar queacute relacioacuten existe entre la edad de un cerdo empieza a recibir un complemento alimenticio de reciente creacioacuten el peso inicial del anima

mento de peso en un periodo de una semana con el complemento alimenticio La siguiente infoes resultado de un estudio de ocho lechones

X 1 X 2 Y

Nuacutemero Peso inicial Edad inicial Aumentode lechoacuten (libras) (semanas) de peso

1 39 8 7

2 52 6 6

3 49 7 8

4 46 12 10

5 61 9 9

6 35 6 5

7 25 7 38 55 4 4

a) Calcule la ecuacioacuten de miacutenimos cuadrados que mejor describa estas tres variablesb) iquestCuaacutento podemos esperar que un cerdo aumente de peso en una semana con el complemento

ticio si teniacutea nueve semanas de edad y pesaba 48 libras 13-12 Una estudiante graduada que quiere comprar un auto Neptune usado investigoacute los precios Pien

antildeo del modelo y el nuacutemero de millas recorridas influyen en el precio de compra Los datos siguirresponden a 10 autos con precio (Y ) en miles de doacutelares antildeo ( X 1) y millas recorridas ( X 2) en ma) Encuentre (calcule) la ecuacioacuten de miacutenimos cuadrados que mejor relacione estas tres variabb) La estudiante desea comprar un Neptune 1991 con alrededor de 40000 millas recorridas

pronostica que pagaraacute

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 956

(Y ) X 2

Precio X 1 Millas(miles de doacutelares) Antildeo (miles)

299 1987 556

602 1992 184

887 1993 213

392 1988 469

955 1994 118

905 1991 364

937 1992 282

42 1988 44248 1989 349

574 1991 264

13-13 La Reserva Federal de Estados Unidos realiza un estudio preliminar para determinar la relacioacuten etos indicadores econoacutemicos y el cambio porcentual anual en el producto interno bruto (PIB) Dindicadores examinados son el monto del deacuteficit del gobierno federal (en miles de millones de del promedio industrial Dow Jones (el valor medio del antildeo) Los datos correspondientes a seis antilde

Y X 1 X 2

Cambio en el PIB Deacuteficit federal Dow Jones

25 100 2850

Ϫ10 400 2100

40 120 330010 200 2400

15 180 2550

30 80 2700

a) Encuentre (calcule) la ecuacioacuten de miacutenimos cuadrados que mejor describa los datosb) iquestQueacute porcentaje de cambio en el PIB se esperariacutea en un antildeo en el cual el deacuteficit federal fue

millones de doacutelares y el promedio Dow Jones fue 3000

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-1 a) Y X 1 X 2 X 1Y X 2Y X 1X 2 X 2

1 X 2

2

25 35 50 875 1250 175 1225 2500

30 67 42 2010 1260 2814 4489 1764

11 15 85 165 935 1275 225 7225

22 03 14 66 308 042 009 196

27 46 36 1242 972 1656 2116 1296

19 20 13 380 247 260 400 169

1 ෆ3 ෆ4 ෆ 1 ෆ8 ෆ ෆ6 ෆ 2 ෆ4 ෆ ෆ0 ෆ 4 ෆ7 ෆ3 ෆ ෆ8 ෆ 4 ෆ9 ෆ7 ෆ ෆ2 ෆ 7 ෆ7 ෆ ෆ9 ෆ7 ෆ 8 ෆ4 ෆ ෆ6 ෆ4 ෆ 1 ෆ3 ෆ1 ෆ ෆ5 ෆ0 ෆ

Las ecuaciones 13-2 13-3 y 13-4 se convierten en

Y ϭ na ϩ b1 X 1 ϩ b2 X 2 134 ϭ 6 a ϩ 186b1 ϩ 240 b2

X 1Y ϭ a X 1 ϩ b1 X 21 ϩb2 X 1 X 2 4738 ϭ 186a ϩ 8464b1 ϩ 7797b2

X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22 4972 ϭ 240a ϩ 7797b1 ϩ 13150b2

Al resolver estas ecuaciones de manera simultaacutenea se obtiene

a ϭ 203916 b1 ϭ 23403 b2 ϭ Ϫ13283

De modo que la ecuacioacuten de regresioacuten es Y ˆ ϭ 203916 ϩ 23403 X 1 Ϫ 13283 X 2b) Con X 1 ϭ 30 y X 2 ϭ 27

Y ˆ = 203916 ϩ 23403(30) Ϫ 13283(27) ϭ 2883

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1056

EA 13-2 a) En este problema Y ϭ renta X 1 ϭ nuacutemero de habitaciones X 2 ϭ distancia al centro

Y X 1 X 2 X 1Y X 2Y X 1X 2 X 2

1 X 2

2 Y 2

360 2 1 720 360 2 4 1 129600

1000 6 1 600 1000 6 36 1 1000000

450 3 2 1350 900 6 9 4 202500

525 4 3 2100 1575 12 16 9 272625

350 2 10 700 3500 20 4 100 122500

300 1 4 300 1200 4 1 16 90000

2985 18 21 11170 8535 50 70 131 1820225

Las ecuaciones 13-2 13-3 y 13-4 se convierten en

Y ϭ na ϩ b1 X 1 ϩb2 X 2 2985 ϭ 6a ϩ 18b1 ϩ 21b2

X 1Y ϭ a X 1 ϩ b1 X 21 ϩb2 X 1 X 2 11170 ϭ 18a ϩ 70b1 ϩ 50b2

X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22 8535 ϭ 21a ϩ 50b1 ϩ 131b2

Al resolver estas ecuaciones simultaacuteneas se obtiene

a ϭ 964581 b1 ϭ 1364847 b2 ϭ Ϫ24035

De manera que la ecuacioacuten de regresioacuten es

Y ˆ ϭ 964581 ϩ 1364847 X 1 Ϫ 24035 X 2

b) Cuando el nuacutemero de habitaciones ϭ 2 y la distancia al centro ϭ 2

Y ˆ ϭ 964581 ϩ 1364847(2) Ϫ 24035(2) ϭ $365

133 La computadora y la regresioacutenmuacuteltiple

En el capiacutetulo 12 y hasta donde vamos de eacuteste hemos presentado problemas simplificados y muestrasde tamantildeo pequentildeo Despueacutes del ejemplo de la seccioacuten anterior probablemente usted haya llegadoa la conclusioacuten de que no estaacute interesado en la regresioacuten si tiene que hacer los caacutelculos a mano Dehecho conforme aumenta el tamantildeo de las muestras y crece el nuacutemero de variables independientespara la regresioacuten hacer los caacutelculos incluso con la ayuda de una calculadora de bolsillo se convier-te en algo muy inconveniente

Sin embargo como administradores debemos manejar problemas complejos que requieren mues-tras maacutes grandes y variables independientes adicionales Como ayuda para resolver estos problemasmaacutes detallados utilizaremos una computadora que nos permitiraacute realizar un gran nuacutemero de caacutelcu-los en poco tiempo

Suponga que tenemos no una ni dos variables independientes sino un nuacutemero k de ellas X 1

X 2 X k Como antes sea n el nuacutemero de datos que se tienen La ecuacioacuten de regresioacuten que inten-tamos estimar es

Inconvenienciadel caacutelculo deregresiones a mano

Ecuacioacuten de estimacioacuten de regresioacuten muacuteltiple

Y ˆ ϭ

b1 X 1ϩ

b2 X 2ϩ ϩ

bk X k [13-5]

Ahora veremos coacutemo podemos utilizar una computadora para estimar los coeficientes de regresioacutenPara demostrar coacutemo una computadora maneja el anaacutelisis de regresioacuten muacuteltiple tomemos el pro-

blema del Servicio Interno de Contribuciones (IRS) de la seccioacuten anterior Suponga que el departa-mento de auditoriacuteas agrega a su modelo la informacioacuten correspondiente a las recompensas para losinformantes La dependencia desea incluir esta tercera variable independiente X 3 debido a que sien-

Demostracioacuten de laregresioacuten muacuteltipleen la computadora

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1156

te que existe cierta relacioacuten entre estas recompensas y el descubrimiento de impuestos no pEn la tabla 13-3 se registroacute la informacioacuten de los uacuteltimos 10 meses

Para resolver este problema la divisioacuten de auditoriacutea usoacute el procedimiento de regresioacutende Minitab Por supuesto todaviacutea no sabemos coacutemo interpretar la solucioacuten que proporciocomo veremos la mayor parte de los nuacutemeros dados en la solucioacuten corresponden muy de c

los estudiados en el contexto de regresioacuten simple

Salida de Minitab

Una vez que se introducen los datos y se eligen las variables dependiente e independientescalcula los coeficientes de regresioacuten y varios estadiacutesticos asociados con la ecuacioacuten de regrveraacute la salida del programa para el problema del IRS La figura 13-2 da la primera parte de la

1 La ecuacioacuten de regresioacuten De los nuacutemeros dados en la columna Coef se puede leercioacuten de estimacioacuten

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ b3 X 3

ϭ Ϫ45796 ϩ 0597 X 1 ϩ 1177 X 2 ϩ 0405 X 3

Podemos interpretar esta ecuacioacuten en una forma similar a la de la ecuacioacuten de regresioacutevariables en la paacutegina 558 Si se mantienen constantes el nuacutemero de horas de audicampo X 1 y el nuacutemero de horas de computadora X 2 y se cambian las recompeninformantes X 3 entonces el valor de Y ˆ aumentaraacute $405000 por cada $1000 pagadosformantes De igual manera al mantener X 1 y X 3 constantes se ve que por cada 1adicionales de tiempo de computadora Y ˆ aumentaraacute $1177000 Por uacuteltimo si se dej

Buacutesqueda e interpre-tacioacuten de la ecuacioacutende regresioacuten

Salida del programaMinitab

Uso de Minitab pararesolver problemasde regresioacuten muacuteltiple

Factores relacionadoscon el descubrimientode impuestos nopagados

Tabla 13-3 Horas en Impueauditoriacuteas Horas Recompensa pagde campo en computadora a informantes descub(cientos) (cientos) (miles) (mill

Mes X 1 X 2 X 3

Enero 45 16 71 2

Febrero 42 14 70 2

Marzo 44 15 72 2

Abril 45 13 71 2

Mayo 43 13 75 2

Junio 46 14 74 2

Julio 44 16 76 3

Agosto 45 16 69 2

Septiembre 44 15 74 2

Octubre 43 15 73 2

FIGURA 13-2

Salida de Minitabpara la regresioacuten

del ServicioInterno deContribuciones

Anaacutel i s i s de r e gr e s i oacuten

La ec ua ci oacuten de r egr es i oacuten es

DESCUBRE ϭ mdash45 0 ϩ 0 597 AUDI T ϩ 1 18 COMPUTADORA ϩ 0 405 RECOMPENS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e Ϫ45 796 4 878 Ϫ9 39 0 000AUDI T 0 50697 0 08112 7 36 0 000COMPUTADORA 1 17684 0 08407 14 00 0 000RECOMPENSA 0 40511 0 04223 9 59 0 000

s ϭ 0 2861 R- s q ϭ 98 3

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1256

tantes X 2 y X 3 se estima que 100 horas adicionales dedicadas a auditoriacuteas de campo descubri-raacuten $597000 adicionales de impuestos no pagados Observe que se redondearon los valoresproporcionados por la regresioacuten dada por Minitab (figura 13-2)

Suponga que en noviembre el IRS intenta dejar las horas de trabajo en auditoriacuteas de cam-po y las horas en computadora en sus niveles de octubre (4300 y 1500) pero decide aumen-tar las recompensas pagadas a los informantes a $75000 iquestCuaacutento de impuestos no pagadosesperan descubrir en noviembre Sustituyendo estos valores en la ecuacioacuten de regresioacuten esti-mada obtenemos

Y ˆ ϭ Ϫ45796 ϩ 0597 X 1 ϩ 1177 X 2 ϩ 0405 X 3

Y ˆ ϭ Ϫ45796 ϩ 0597(43) ϩ 1177(15) ϩ 0405(75)

Y ˆ ϭ Ϫ45796 ϩ 25671 ϩ 17655 ϩ 30375

Y ˆ ϭ 27905 larr Descubrimientos estimados $27905000

De modo que el departamento de auditoriacuteas espera descubrir aproximadamente $28 millonesde evasioacuten de impuestos en noviembre

2 Una medida de dispersioacuten el error estaacutendar de la estimacioacuten de la regresioacuten muacuteltiple Ya quehemos determinado la ecuacioacuten que relaciona a nuestras tres variables necesitamos una me-dida de la dispersioacuten alrededor de este plano de regresioacuten muacuteltiple En la regresioacuten simple laestimacioacuten es maacutes precisa conforme el grado de dispersioacuten alrededor de la regresioacuten es menorLo mismo es cierto para los puntos de la muestra que se encuentran alrededor del plano de re-gresioacuten muacuteltiple Para medir esta variacioacuten debemos utilizar de nuevo la medida conocida co-

mo error estaacutendar de la estimacioacuten

Medicioacuten de ladispersioacuten alrededordel plano de regre-sioacuten muacuteltiple usodel error estaacutendar dela estimacioacuten

Error estaacutendar de la estimacioacuten

se ϭ Ί [13-6]Y ndash Y ˆ )2ᎏᎏ

n Ϫ k Ϫ 1

donde

bull Y ϭ valores muestrales de la variable dependientebull Y ˆ ϭ valores correspondientes estimados con la ecuacioacuten de regresioacutenbull n ϭ nuacutemero de puntos de la muestrabull k ϭ nuacutemero de variables independientes (ϭ 3 en nuestro ejemplo)

El denominador de esta ecuacioacuten indica que en la regresioacuten muacuteltiple con k variables in-

dependientes el error estaacutendar tiene n Ϫ k Ϫ 1 grados de libertad Esto se debe a que los

grados de libertad se reducen de n en k ϩ 1 constantes numeacutericas a b1 b2 hellip b k que se

estimaron a partir de la misma muestra

Para calcular se observamos los errores individuales (Y Ϫ Y ˆ ) en el plano de regresioacuten ajus-tado los elevamos al cuadrado calculamos su media (dividiendo entre n Ϫ k Ϫ 1 en lugar den) y tomamos la raiacutez cuadrada del resultado Debido a la forma en que se calcula se se cono-ce a veces como raiacutez del error cuadraacutetico medio [o raiacutez de mse (mean-square error)] De lasalida de Minitab que usa s en lugar de se para denotar el error estaacutendar vemos que la raiacutez demse en el problema del Servicio Interno de Contribuciones es 0286 es decir $286000

Como en el caso de la regresioacuten simple podemos utilizar el error estaacutendar de la estimacioacuteny la distribucioacuten t para formar un intervalo de confianza alrededor de nuestro valor estimadoY ˆ En el problema de la evasioacuten de impuestospara 4300 horas de trabajo en auditoriacuteas de cam-po 1500 horas en computadora y $75000 de pago a informantes Y ˆ es $27905000 como es-timacioacuten de impuestos no pagados descubiertos y se es $286000 Si deseamos construir unintervalo de confianza del 95 alrededor de esta estimacioacuten de $27905000 miramos enla tabla 2 del apeacutendice en la columna del 5 y localizamos ahiacute el rengloacuten correspondiente a

Intervalos deconfianza para Y ˆ

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1356

n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad El valor apropiado de t para nuestracioacuten del intervalo es de 2447 En consecuencia podemos calcular los liacutemites de nutervalo de confianza como sigue

Y ˆ ϩ t (se) ϭ 27905000 ϩ (2447)(286000)

Y ˆ ϩ t(se) ϭ 27905000 ϩ 699800

Y ˆ ϩ t(se) ϭ 28604800 larr Liacutemite superior

Y ˆ Ϫ t (se) ϭ 27905000 Ϫ (2447)(286000)

Y ˆ ϩ t(se) ϭ 27905000 ndash 699800

Y ˆ ϩ t(se) ϭ 27205200 larr Liacutemite inferior

Con un nivel de confianza del 95 el departamento de auditoriacuteas puede sentirse sque los descubrimientos reales estaraacuten en este intervalo que va de $27205200 a $28Si el IRS desea usar un nivel de confianza menor como 90 puede reducir el intevalores para la estimacioacuten de descubrimientos de impuestos no pagados Igual que cgresioacuten simple podemos utilizar la distribucioacuten normal estaacutendar (tabla 1 del apeacutendaproximar la distribucioacuten t siempre que los grados de libertad (n menos el nuacutemero cientes de regresioacuten estimados) sea un nuacutemero mayor que 30

Al antildeadir la tercera variable independiente (recompensas a informantes) iquestmejoroacuteregresioacuten Como se mide la dispersioacuten de los datos alrededor del plano de regresioacutenmenores de se deberiacutean indicar mejores regresiones Para la regresioacuten de dos variablecimos con anterioridad en este mismo capiacutetulo se resultoacute ser 1076 Como al agregarra variable se se redujo a 0286 vemos que siacute mejoroacute el ajuste de la regresioacuten en este Sin embargo en general no es cierto que al agregar variables siempre se reduzc

3 El coeficiente de determinacioacuten muacuteltiple Al estudiar el anaacutelisis de correlacioacuten simpmos la fuerza de la relacioacuten entre dos variables utilizando el coeficiente de determinla muestra r 2 Este coeficiente de determinacioacuten es la fraccioacuten de la variacioacuten total riable dependiente Y que se explica con la ecuacioacuten de estimacioacuten

Similarmente en la correlacioacuten muacuteltiple mediremos la fuerza de la relacioacuten entre trbles utilizando el coeficiente de determinacioacuten muacuteltiple R

2 o su raiacutez cuadrada R (el cte de correlacioacuten muacuteltiple) Este coeficiente de determinacioacuten muacuteltiple es tambieacuten la

que representa la porcioacuten de la variacioacuten total de Y que ldquoexplicardquo el plano de regr

Note que la salida del programa da el valor 983 para R2 Esto nos dice que las tr

bles independientes explican el 983 de la variacioacuten total de impuestos no pagadobiertos Para la regresioacuten de dos variables hecha antes R2 es soacutelo 0729 asiacute que las trabajo en auditoriacutea de campo y las horas en computadora explican el 729 de la vaagregar las recompensas a los informantes explica el 254 restante de la variacioacuten

Todaviacutea no hemos explicado los nuacutemeros en las columnas etiquetadas con Desvciente t y p de la figura 13-2 Estos nuacutemeros se utilizaraacuten para hacer inferencias acercano de regresioacuten de la poblacioacuten tema que se trataraacute en la seccioacuten 13-4

Uso del coeficientede determinacioacutenmuacuteltiple

Valor de variablesadicionales

Interpretacioacuten delintervalo deconfianza

Ya nadie calcula regresiones a mano hayotras cosas maacutes interesantes en queacute ocu-par nuestro tiempo Se explicoacute la teacutecnicacalculando las soluciones a mano para

que no tenga que pensar en su computadora como en unaldquocaja negrardquo que hace muchas cosas uacutetiles que no puedeexplicar Sugerencia el valor real de usar la computadorapara calcular regresiones muacuteltiples es que puede manejarmuchas variables independientes y obtener una mejor ecua-

cioacuten de estimacioacuten que puede medir si agregar otrble independiente realmente mejora los resultados yposible observar con rapidez el comportamiento de

indica la proporcioacuten de la variacioacuten total de la variapendiente que se explica con las variables indepenLa computadora hace todo el trabajo tedioso mdashsin semdash y le deja tiempo para el trabajo maacutes importcomprender los resultados y usarlos para tomar mdecisiones

SUGERENCIASY

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1456

La ec uac i oacuten de r egr es i oacuten esY = - 12 75 + 17 1 X1 + 0 54 1 X2 - 0 17 4 X3

Pr onos t i c ador Coe f De s vEs t Coc i e nt e - t pCons t a n t e - 1275 2699 - 0 47 0 719X1 17 059 6 908 2 47 0 245X2 0 5406 0 3144 1 72 0 335X3 - 0 1743 0 1005 - 1 73 0 333

s = 396 1 R- s q = 87 2

b) iquestQueacute porcentaje de la variacioacuten total del nuacutemero de solicitudes urgentes de devolucioacuten de impuestosexplica esta ecuacioacuten

c) Para este antildeo el iacutendice econoacutemico es 169 la poblacioacuten residente en un radio de una milla desde la

oficina es 10212 habitantes y el ingreso promedio en Ithaca es $26925 iquestCuaacutentas solicitudes urgen-tes de devolucioacuten de impuestos debe Pam esperar procesar entre el 1 de marzo y el 15 de abril

Conceptos baacutesicos 13-14 Dado el siguiente conjunto de datos utilice el paquete de software que tenga disponible para encontrar la

ecuacioacuten de regresioacuten de mejor ajuste y responda a lo siguientea) iquestCuaacutel es la ecuacioacuten de regresioacutenb) iquestCuaacutel es el error estaacutendar de la estimacioacutenc) iquestCuaacutel es el valor de R

2 para esta regresioacutend) iquestCuaacutel es el valor pronosticado para Y cuando X 1 ϭ 58 X 2 ϭ 42 y X 3 ϭ 51

Y X 1 X 2 X 3

647 35 53 85809 74 16 26246 25 63 45439 37 94 88777 55 14 36206 83 92 25669 67 25 27343 12 22 13

Ejercicios 133

Ejercicios de autoevaluacioacuten

EA 13-3 Pam Schneider posee y opera un despacho de contadores en Ithaca Nueva York Ella piensa que seriacutea uacutetilpredecir el nuacutemero de solicitudes urgentes de devolucioacuten de impuestos que le pediraacuten durante el ajetrea-do periodo del 1 de marzo al 15 de abril para poder planear mejor sus necesidades de personal duranteesta eacutepoca Tiene la hipoacutetesis de que varios factores pueden ser uacutetiles para su pronoacutestico Los datos de es-tos factores y el nuacutemero de solicitudes urgentes de devolucioacuten de impuestos de antildeos pasados son

Y X 2 Nuacutemero de

Poblacioacuten solicitudesresidente X 3 de devolucioacuten

X 1 en un radio Ingreso urgentesIacutendice de una milla promedio (1 de marzo

econoacutemico desde la oficina en Ithaca a 15 de abril)

99 10188 21465 2306106 8566 22228 1266100 10557 27665 1422129 10219 25200 1721179 9662 26300 2544

a) Use el siguiente resultado de Minitab para determinar la ecuacioacuten de regresioacuten maacutes adecuada para es-

tos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1556

13-15 Dado el siguiente conjunto de datos utilice el paquete de software que tenga a su disposicioacuten patrar la ecuacioacuten de regresioacuten de mejor ajuste y responda a lo siguientea) iquestCuaacutel es la ecuacioacuten de regresioacutenb) iquestCuaacutel es el error estaacutendar de la estimacioacutenc) iquestCuaacutel es el valor de R2 para esta regresioacutend) Deacute un intervalo de confianza para la estimacioacuten del 95 para el valor Y cuando los valores X

y X 4 son 524 416 358 y 3 respectivamente

X 1 X 2 X 3 X 4 Y

214 629 219 Ϫ2 228

517 407 429 5 937418 818 698 2 649

118 410 909 Ϫ4 192

716 226 129 8 558

919 615 309 1 231

Aplicaciones

1316 Las estaciones de policiacutea en Estados Unidos estaacuten interesadas en predecir el nuacutemero de arrestodos que deberaacuten procesar cada mes para programar mejor a los empleados de oficina En los daricos el nuacutemero promedio de arrestos (Y ) cada mes tiene influencia del nuacutemero de oficiales en

policiaca ( X 1) la poblacioacuten de la ciudad en miles ( X 2) y el porcentaje de personas desempleadasdad en miles ( X 3) Los datos de estos factores en 15 ciudades se presentan en la tablaa) Utilice el paquete de software que tenga disponible para determinar la ecuacioacuten de regresioacuten

jor se ajuste a estos datosb) iquestQueacute porcentaje de la variacioacuten total en el nuacutemero de arrestos (Y ) explica esta ecuacioacutenc) El departamento de policiacutea de ChapelBoro desea pronosticar el nuacutemero de arrestos mensua

pelBoro tiene una poblacioacuten de 75000 habitantes 82 elementos en su fuerza policiaca y utaje de desempleo del 105 iquestCuaacutentos arrestos pronostica para cada mes

Nuacutemero promedio Nuacutemero de oficiales Tamantildeo de la ciudad (X 2) Porcende arrestos mensuales (Y ) en la fuerza (X 1) en miles de habitantes desemp

3906 68 816 4

5043 94 751 3

6284 125 973 5

7456 175 1235 8

5852 113 1184 11

4503 82 654 9

3278 46 616 12

2605 32 543 18

4775 89 974 4

3898 67 824 6

3124 47 564 8

3675 59 713 7

3744 61 674 9

4946 87 963 11

4875 92 864 4

13-17 Estamos intentando predecir la demanda anual (DEMAND) de cierto producto utilizando las svariables independientes

PRECIO ϭ precio del producto (en doacutelares)

INGRESO ϭ ingreso del consumidor (en doacutelares)

SUB ϭ precio de un bien sustituto (en doacutelares)

( Nota Un bien sustituto es aquel que puede suplir a otro bien Por ejemplo la margarina es untituto de la mantequilla)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1656

Se recolectaron datos correspondientes al periodo 1982-1996

Antildeo Demanda Precio ($) Ingreso ($) Sub ($)

1982 40 9 400 101983 45 8 500 141984 50 9 600 121985 55 8 700 131986 60 7 800 111987 70 6 900 151988 65 6 1000 161989 65 8 1100 17

1990 75 5 1200 221991 75 5 1300 191992 80 5 1400 201993 100 3 1500 231994 90 4 1600 181995 95 3 1700 241996 85 4 1800 21

a) Utilice el paquete de software que tenga disponible para encontrar la ecuacioacuten de regresioacuten ajuste para estos datos

b) iquestSon los signos (ϩ o Ϫ) de los coeficientes de regresioacuten de las variables independientes los qperan Deacute una explicacioacuten breve ( Nota Eacutesta no es una pregunta estadiacutestica soacutelo necesita pesignifican los coeficientes de regresioacuten)

c) Establezca e interprete el coeficiente de determinacioacuten muacuteltiple del problemad) Establezca e interprete el error estaacutendar de la estimacioacuten para el problemae) Seguacuten la ecuacioacuten de regresioacuten obtenida iquestqueacute valor de DEMAND predeciriacutea si el precio de

ductos fue $6 el ingreso del consumidor $1200 y el precio del bien sustituto $17 13-18 Bill Buxton profesor de estadiacutestica de una prominente escuela de administracioacuten tiene un prof

tereacutes en los factores que afectan el desempentildeo de los estudiantes en los exaacutemenes El examen psemestre anterior tuvo una distribucioacuten de calificaciones amplia pero Bill tiene la certeza de qfactores explican esa distribucioacuten permite a sus estudiantes que estudien en tantos libros comoca el coeficiente de inteligencia de los estudiantes variacutea tienen distintas edades y difieren losque dedican a estudiar Con el propoacutesito de desarrollar una foacutermula de prediccioacuten para las califde los exaacutemenes Bill pidioacute a cada estudiante que respondiera al final del examen preguntas refe

tiempo de estudio y nuacutemero de libros utilizados Los registros que teniacutea Bill ya incluiacutean el coefiinteligencia y la edad de modo que reunioacute los datos del grupo y corrioacute la regresioacuten muacuteltiple deLa salida de la corrida de Bill fue la siguiente

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t Con s t a nt e minus49 948 41 55 minus1 20 0HORAS 1 06931 0 98163 1 09 0CI 1 36460 0 37627 3 63 0LI BROS 2 03982 1 50799 1 35 0EDAD minus1 79890 0 67332 minus2 67 0

s = 11 657 R- s q = 76 7

a) iquestCuaacutel es la ecuacioacuten de regresioacuten de mejor ajuste para estos datos

b) iquestQueacute porcentaje de la variacioacuten en las calificaciones se explica con esta ecuacioacutenc) iquestQueacute calificacioacuten esperariacutea usted para un estudiante de 21 antildeos de edad con un coeficiente gencia (CI) de 113 que estudioacute durante cinco horas y utilizoacute tres libros diferentes

13-19 La compantildeiacutea de tiendas de abarrotes Twenty-Two estaacute planeando expandir su cadena Como ayudleccionar los lugares donde abriraacute las nuevas tiendas recolectoacute datos de las ventas semanales de casus 23 tiendas Para explicar la variabilidad de las ventas semanales tambieacuten reunioacute informacioacutencribe cuatro variables que se cree estaacuten relacionadas con las ventas Las variables se definen como

VENTAS ϭ ventas semanales promedio en cada tienda en miles de doacutelares

AUTOS ϭ volumen promedio de traacutensito de automoacuteviles por semana en miles de autos

ENTRADA ϭ facilidad de entradasalida medida en una escala de 1 a 100

INGANUAL ϭ ingreso anual promedio por familia en el aacuterea en miles de doacutelares

DISTANCIA ϭ distancia en millas desde la tienda al supermercado maacutes cercano

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1756

Los datos se analizaron con Minitab y la salida es la siguiente

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t Cons t a nt e 175 37 92 62 1 89 0 0AUTOS - 0 028 0 315 minus0 09 0 9ENTRADA 3 775 1 272 2 97 0 0I NGANUAL 1 990 4 510 0 44 0 6DI STANCI A 212 41 28 090 7 56 0 0

s = 85 587 R- s q = 95 8

a) iquestCuaacutel es la ecuacioacuten de regresioacuten de mejor ajuste dada por Minitab

b) iquestCuaacutel es el error estaacutendar de la estimacioacuten para esta ecuacioacutenc) iquestQueacute fraccioacuten de la variacioacuten en las ventas se explica con esta regresioacutend) iquestQueacute ventas predeciriacutea para una tienda localizada en un vecindario que tuvo un ingreso anu

milia de $20000 estaba a 2 millas del supermercado maacutes cercano se encontraba en una calvolumen promedio semanal de traacutensito de 100000 autos y con una facilidad de entrada de

13-20 Rick Blackburn estaacute pensando en vender su casa Con el fin de decidir el precio que pediraacute poreunido datos de 12 ventas recientes Registroacute el precio de venta (en miles de doacutelares) el nuacutemercuadrados de construccioacuten (en cientos de pies cuadrados) el nuacutemero de pisos el nuacutemero de bantiguumledad de la casa (en antildeos)

Precio de venta Pies cuad Pisos Bantildeos Antiguumledad

4965 89 1 10 2

6795 95 1 10 68115 126 2 15 11

8160 129 2 15 8

9150 190 2 10 22

9525 176 1 10 17

10035 200 2 15 12

10425 206 2 15 11

11265 205 1 20 9

14970 251 2 20 8

16065 227 2 20 18

23250 408 3 40 12

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de

de mejor ajuste para los datosb) iquestCuaacutel es el valor de R2 para esta ecuacioacutenc) Si la casa de Rick tiene 1800 pies cuadrados (ϭ 180 cientos de pies cuadrados) un piso

y seis antildeos de antiguumledad iquestqueacute precio de venta puede esperar Rick 13-21 La Allegheny Steel Corporation ha estado buscando los factores que influyen en la cantidad de

millones de toneladas) que puede vender cada antildeo La administracioacuten sospecha que los siguientfactores principales la tasa anual de inflacioacuten del paiacutes el precio promedio por tonelada del acetado que acota los precios (en doacutelares) de Allegheny y el nuacutemero de automoacuteviles (en millonesfabricantes de autos de Estados Unidos planean producir ese antildeo Se recolectaron los datos de losiete antildeos

Y X 2 X 3

Millones X 1 Cota de Nuacutemero

de tons Tasa de importa- deAntildeo vendidas inflacioacuten ciones automoacuteviles

1993 42 31 310 62

1992 31 39 500 51

1991 40 75 220 57

1990 47 107 450 71

1989 43 155 435 65

1988 37 130 260 61

1987 35 110 305 59

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1856

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de regresioacutende mejor ajuste para los datos

b) iquestQueacute porcentaje de la variacioacuten total de la cantidad de acero vendido (en millones de toneladas) porAllegheny cada antildeo explica esta ecuacioacuten

c) iquestCuaacutentas toneladas de acero deberaacute esperar Allegheny vender en un antildeo en el que la tasa de inflacioacutenes 71 los fabricantes de automoacuteviles norteamericanos planean producir 60 millones de autos y la co-ta promedio del acero importado por tonelada es $350

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-3 De la salida del paquete de software se obtienen los siguientes resultadosa) Y ˆ ϭ Ϫ1275 ϩ 17059 X 1 ϩ 05406 X 2 Ϫ 01743 X 3b) R

2ϭ 872 el modelo explica el 872 de la variacioacuten total en Y

c) Y ˆ ϭ Ϫ1275 ϩ 17059(169) ϩ 05406(10212) Ϫ 01743(26925) ϭ 2436 reembolsos de impuestos

134 Inferencias sobre paraacutemetrosde poblacioacuten

En el capiacutetulo 12 se vio que la recta de regresioacuten de la muestra Y ˆ ϭ a ϩ bX (ecuacioacuten 12-3) esti-maba la recta de regresioacuten de la poblacioacuten Y ϭ A ϩ BX (ecuacioacuten 12-13) La razoacuten por la cual soacute-lo podiacuteamos estimar la recta de regresioacuten de poblacioacuten y no determinarla con exactitud era que los

puntos no caen exactamente en la recta de regresioacuten de la poblacioacuten Debido a las variaciones alea-torias los puntos satisfaciacutean Y ϭ A ϩ BX ϩ e (ecuacioacuten 12-13a) maacutes que a Y ϭ A ϩ BX

En la regresioacuten muacuteltiple se tiene justo la misma situacioacuten Nuestro plano de regresioacuten estimado

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k [13-5]

es una estimacioacuten de un plano de regresioacuten de poblacioacuten verdadero pero desconocido de la forma

Plano de regresioacutende la poblacioacuten

De nuevo los puntos individuales normalmente no caen con exactitud en el plano de regresioacuten depoblacioacuten Consideremos el problema del Servicio Interno de Contribuciones para ver por queacute Notodos los pagos a informantes tendraacuten la misma efectividad Algunas horas en computadora podriacuteanutilizarse para recolectar y organizar datos otras para analizar esos datos en busca de errores y frau-des El eacutexito de la computadora en descubrir impuestos no pagados puede depender de cuaacutento tiempose dedique a cada una de estas actividades Por eacutestas y otras razones algunos de los puntos se en-contraraacuten arriba del plano de regresioacuten y algunos estaraacuten abajo de eacuteste En lugar de satisfacer laecuacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

los puntos individuales satisfaraacuten la ecuacioacuten

Las variaciones alea-torias desplazan lospuntos del plano deregresioacuten

Ecuacioacuten de regresioacuten de la poblacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

Plano de regresioacuten de la poblacioacuten maacutes la variacioacuten aleatoria

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e [13-7a]

La cantidad e que aparece en la ecuacioacuten 13-7a es una variacioacuten aleatoria que en promedio es iguala cero La desviacioacuten estaacutendar de las variaciones individuales e y el error estaacutendar de la estima-cioacuten se que estudiamos en la seccioacuten anterior es una estimacioacuten de e

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1956

Como nuestro plano de regresioacuten de la muestra Y ˆ ϭ a ϩ b1X1 ϩ b2 X 2 ϩ ϩ bk X k (ecuaci13-7) estima el plano de regresioacuten de poblacioacuten desconocido Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk

(ecuacioacuten 13-7) deberemos ser capaces de usarlo para hacer inferencias sobre el plano de regreside la poblacioacuten En esta seccioacuten haremos inferencias acerca de las pendientes ( B1 B2 Bk ) deecuacioacuten de regresioacuten ldquoverdaderardquo (la que se aplica a la poblacioacuten completa) basadas en las pendietes (b1 b2 bk ) de la ecuacioacuten de regresioacuten estimada a partir de la muestra de datos

Inferencias acerca de una pendiente individual B i El plano de regresioacuten se deriva de una muestra y no de la poblacioacuten completa Como resultado

podemos esperar que la ecuacioacuten de regresioacuten verdadera Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k que se aplica a la poblacioacuten completa) sea exactamente igual que la ecuacioacuten estimada a partir observaciones de la muestra Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k Sin embargo podemos utilizarvalor de bi una de las pendientes que calculamos a partir de la muestra para probar hipoacutetesis acca del valor de Bi una de las pendientes del plano de regresioacuten para la poblacioacuten completa

El procedimiento para probar una hipoacutetesis respecto a Bi es parecido al procedimiento analizaen los capiacutetulos 8 y 9 sobre pruebas de hipoacutetesis Para entender este proceso regresemos al probma que relaciona los impuestos no pagados descubiertos con las horas de trabajo en auditoriacuteas campo horas en computadora y recompensas a informantes En la paacutegina 729 sentildealamos que b10597 El primer paso consiste en encontrar un valor para B1 y compararlo con b1 ϭ 0597

Suponga que durante un periodo largo la pendiente de la relacioacuten entre Y y X 1 fue 0400 Paprobar si todaviacutea es vaacutelida podriacuteamos definir las hipoacutetesis como

H0 B1 ϭ 0400 larr Hipoacutetesis nula

H1 B1 0400 larr Hipoacutetesis alternativa

De hecho realizamos la prueba para saber si los datos actuales indican que B1 ha cambiado su vahistoacuterico de 0400

Para encontrar el estadiacutestico de prueba para B1 es necesario hallar primero el error estaacutendar d

coeficiente de regresioacuten El coeficiente de regresioacuten con el que estamos trabajando es b1 de moque el error estaacutendar de este coeficiente se representa con sb1

Resulta demasiado difiacutecil calcular sb1 a mano pero por fortuna Minitab calcula los errores estaacutedar de todos los coeficientes de regresioacuten Por comodidad repetimos la figura 13-2 Los errores taacutendar de los coeficientes se dan en la columna DesvEst de la salida de Minitab

En el cuadro de salida vemos que sb1

es 00811 (Similarmente si deseamos probar una hipoacutesis acerca de B2 vemos que el error estaacutendar apropiado que debemos utilizar es sb2 ϭ 00841) Uvez que encontramos sb1 en la salida de Minitab podemos usar la ecuacioacuten 13-8 para estandarizarpendiente de nuestra ecuacioacuten de regresioacuten ajustada

Estandarizacioacutendel coeficiente deregresioacuten

Error estaacutendar delcoeficientede regresioacuten

Prueba de unahipoacutetesis acerca de B i

Diferencia entre la

ecuacioacuten de regre-sioacuten verdadera y unaestimada a partir delas observacionesde la muestra

Coeficiente de regresioacuten estandarizado

t ϭ [13-8bi ndash Bi0ᎏ

sbi

donde

bull biϭ pendiente de la regresioacuten ajustada

bull Bi0 ϭ pendiente real hipoteacutetica para la poblacioacutenbull sbi ϭ error estaacutendar del coeficiente de regresioacuten

iquestPor queacute utilizamos t para denotar el estadiacutestico estandarizado Recuerde que en la regresioacuten siple utilizamos a y b en la ecuacioacuten 12-7 para calcular se y que se estimaba e la desviacioacuten estaacutedar de las variaciones de los datos (ecuacioacuten 12-13a) Entonces utilizamos se en la ecuacioacuten 12-para encontrar sb el error estaacutendar del coeficiente de regresioacuten que corresponde a la pendiente E

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2056

pezamos con n puntos y los usamos para estimar los dos coeficientes a y b Luego basamtras pruebas en la distribucioacuten t con n Ϫ 2 grados de libertad

De manera similar en la regresioacuten muacuteltiple tambieacuten empezamos con n puntos pero lospara estimar k ϩ 1 coeficientes la ordenada a y k pendientes b1 b2 bk Despueacutes estcientes se usan en la ecuacioacuten 13-6 para calcular se que de nuevo es una estimacioacuten de eviacioacuten estaacutendar de las variaciones de los datos (ecuacioacuten 13-7a) Luego se utiliza se (en ucioacuten que estaacute maacutes allaacute del alcance de este libro) para encontrar s

bi Debido a lo anterior

nuestras pruebas de hipoacutetesis en la distribucioacuten t con n Ϫ k Ϫ 1 (ϭ n Ϫ ( k ϩ l)) grados de En nuestro ejemplo el valor estandarizado del coeficiente de regresioacuten es

t ϭ

ϭ

ϭ 2432 larr Coeficiente de regresioacuten estandarizado

Suponga que estamos interesados en probar nuestras hipoacutetesis al nivel de significancia

Como tenemos 10 observaciones en la muestra y tres variables independientes sabemos n Ϫ k Ϫ 1 o 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad Buscamos en la tabla 2 del apeacutendice en lana de 10 y el rengloacuten de 6 grados de libertad Ahiacute vemos que el valor apropiado de t es 19mo nos preocupa si b1 (la pendiente del plano de regresioacuten de la muestra) es significativamferente de B1 (la pendiente hipoteacutetica del plano de regresioacuten de la poblacioacuten) eacutesta es una pdos colas y los valores criacuteticos son Ϯ1943 El coeficiente de regresioacuten estandarizado es 2se encuentra fuera de la regioacuten de aceptacioacuten de nuestra prueba de hipoacutetesis Por consiguichazamos la hipoacutetesis nula de que B1 todaviacutea es igual a 0400 En otras palabras existe unacia suficientemente grande entre b1 y 0400 para concluir que B1 ha cambiado respecto a histoacuterico Por esto sentimos que cada 100 horas adicionales de trabajo en auditoriacuteas de camaumentan la cantidad de descubrimientos de impuestos no pagados en $400000 como lo hel pasado

Ademaacutes de la prueba de hipoacutetesis podemos construir un intervalo de confianza para cude los valores de Bi Del mismo modo que bi es una estimacioacuten puntual de Bi estos intervalofianza son estimaciones de intervalo de Bi Para ilustrar el proceso de construccioacuten de interconfianza encontremos un intervalo de confianza del 95 para B3 en el ejemplo del IRS Lrelevantes son

b3 ϭ 0405 de la figura 13-2sb3 ϭ 00422

t ϭ 2447 larr Nivel de significancia del 5 y 6 grados de libertad

Intervalo deconfianza para B i

Realizacioacuten de la

prueba de hipoacutetesis

0597 ndash 0400ᎏᎏ

0081

b1 ndash B10ᎏ

sb1

Anaacute l i s i s de r e gr e s i oacutenLa ec uaci oacuten de r egr es i oacuten esDESCUBRE = - 45 0 + 0 597 AUDI TORIacute A + 1 18 COMPUTADORA + 0 405 RECOMPENSA

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 45 796 4 878 - 9 39 0 000AUDI TORIacute A 0 50697 0 08112 7 36 0 000COMPUTADORA 1 17684 0 08407 14 00 0 000RECOMPENSAS 0 40511 0 04223 9 59 0 000

s = 0 2861 R- s q = 98 3

FIGURA 13-2

Salida de Minitab(figura repetida)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2156

Con esta informacioacuten podemos calcular el intervalo de confianza de la siguiente manera

b3 ϩ t (sb3) ϭ 0405 ϩ 2447(00422)

ϭ 0508 larr Liacutemite superior

b3 Ϫ t (sb3) ϭ 0405 Ϫ 2447(00422)

ϭ 0302 larr Liacutemite inferior

Vemos que podemos tener una seguridad del 95 de que cada $1000 adicionales pagados a los formantes aumenta el descubrimiento de impuestos no pagados en una cantidad entre $302000$508000

A menudo estaremos interesados en preguntas del tipo iquesten realidad Y depende de X i Por ejeplo podriacuteamos preguntar si descubrir impuestos no pagados en realidad depende de las horas encomputadora Con frecuencia esta pregunta se plantea como iquestes X i una variable explicativa sigficativa de Y Si piensa un poco maacutes se convenceraacute de que si Bi 0 Y depende de las X i (esto esvariacutea cuando X i variacutea) y no depende de X i si Bi ϭ 0

Vemos que nuestra pregunta conduce a establecer hipoacutetesis de la forma

H0 Bi ϭ 0 larr Hipoacutetesis nula X i no es una variable explicativa significativa

H1 Bi 0 larr Hipoacutetesis alternativa X i es una variable explicativa significativa

Podemos probar estas hipoacutetesis utilizando la ecuacioacuten 13-8 del mismo modo que cuando probamnuestras hipoacutetesis acerca de si B1 todaviacutea era igual a 0400 Sin embargo existe una forma maacutes faacutede hacerlo usando la columna de la figura 13-2 de ldquocociente- t rdquo Observemos de nuevo la ecuaci13-8

t ϭ [13-

Como nuestro valor hipoteacutetico de Bi es cero el valor estandarizado del coeficiente de regresioacutedenotado por t o se convierte en

t o ϭ

El valor de t o se conoce como valor t ldquocalculadordquo Eacuteste es el nuacutemero que aparece en la columna equetada como ldquocociente-t rdquo en la figura 13-2 Denotemos por t c el valor t ldquocriacuteticordquo que buscamos

la tabla 2 del apeacutendice Entonces como la prueba para determinar si X i es una variable explicatisignificativa es una prueba de dos colas soacutelo necesitamos verificar si Ϫt c Յ t o Յ t c

Uso de valores t

calculados en lasalida de Minitab

biᎏ

sbi

bi ndash Bi0ᎏ

sbi

iquestEs significativa unavariable explicativa

Prueba para determinar si una variable es o no significativa

Ϫt c Յ t o Յ t c [13-9

donde

bull t c ϭ valor t adecuado (con n Ϫ k Ϫ 1 grados de libertad) para el nivel de significancia deprueba

bull t o ϭ bi sbi ϭ valor t observado (o calculado) obtenido con el paquete de software

Si t o

cae entre Ϫt c

y t c aceptamos H0 y llegamos a la conclusioacuten de que X

ino es una variable exp

cativa significativa En cualquier otro caso rechazamos H0 y concluimos que X i es una variable eplicativa significativa

Probemos al nivel de significancia de 001 si las horas en computadora constituyen una variabexplicativa significativa para los impuestos no pagados descubiertos De la tabla 2 del apeacutendice cn Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad y ϭ 001 vemos que t c ϭ 3707 De la figura 13tenemos que t o = 1400 Como t o Ͼ t c concluimos que el tiempo en computadora es una variab

Prueba de lasignificancia de lavariable horas decomputadora en elproblema del IRS

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2256

explicativa significativa De hecho al observar los valores t calculados para las otras dos vindependientes (tiempo de auditoriacuteas de campo t o ϭ 736 y recompensa a informantes t ovemos que tambieacuten son variables explicativas significativas

Podemos tambieacuten utilizar la columna de ldquoprdquo para probar si X i es una variable explicativacativa De hecho utilizando esa informacioacuten ni siquiera necesitamos usar la tabla 2 del aLos elementos de esta columna son los valores prob para las hipoacutetesis

H0 Biϭ 0

H1 Bi 0

Recuerde del anaacutelisis hecho en el capiacutetulo 9 que estos valores prob constituyen la probabque cada bi esteacute tan lejos de cero como (o maacutes) el valor observado obtenido de la regresioacutenverdadera Como se ilustra en la figura 13-3 solamente necesitamos comparar estos valocon el nivel de significancia de la prueba para determinar si X i es o no una variable expsignificativa para Y

Probar la significancia de una variable explicativa es siempre una prueba de dos colas Lble independiente X i es una variable explicativa significativa si bi es significativamente dife

cero es decir si t o es un nuacutemero grande positivo o negativoPara el ejemplo del IRS repetimos las pruebas con ϭ 001 Para cada una de las tres v

independientes p es menor que 001 de forma que podemos concluir que cada una de ellanificativa

Inferencias acerca de la regresioacuten como un todo

(usando una prueba F )

Suponga que cubre con papel un tablero para dardos y lanza varios dardos sobre eacutel Despueacuteberlo hecho tendraacute algo muy parecido a un diagrama de dispersioacuten Suponga entonces quuna recta de regresioacuten a este conjunto de ldquopuntos observadosrdquo y calcula r

2 Debido a que lofueron lanzados aleatoriamente usted espera obtener un valor bajo de r

2 puesto que en esten realidad no explica a Y Sin embargo si hace esto muchas veces ocasionalmente observalor alto de r

2 por pura casualidadDada cualquier regresioacuten simple (o muacuteltiple) es natural preguntarse si el valor de r2 (

realmente indica que las variables independientes explican a Y o si esto sucede por cas

A menudo esta interrogante se plantea de la siguiente manera iquestla regresioacuten como un todo ficativa En la uacuteltima seccioacuten vimos coacutemo decidir si una X i individual es una variable exp

Significancia de laregresioacuten comoun todo

FIGURA 13-3

Uso de ldquoprdquo paradeterminar si X i esuna variable expli-cativa significativa

Regioacuten de aceptacioacuten Regioacuten de aceptacioacuten

2 del aacuterea

2 del aacuterea

2 del aacuterea

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

ndasht c

ndasht o

t o

t c

0

(a) p es mayor que X

i no es una variable

explicativa significativa

(b) p es menor que X

i es una variable

explicativa significativa

ndasht o

ndasht c

t c

0

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2356

significativa ahora veremos coacutemo decidir si todas las X i tomadas en conjunto explican significavamente la variabilidad observada de Y Nuestras hipoacutetesis son

H0 B1 ϭ B2 ϭ ϭ Bk ϭ 0 larr Hipoacutetesis nula Y no depende de las X i

H1 por lo menos una Bi 0 larr Hipoacutetesis alternativa Y depende de al menos una de las X i

Cuando analizamos r 2 en el capiacutetulo 12 consideramos la variacioacuten total en Y sum(Y Ϫ Y ෆ )2 la p

te de dicha variacioacuten que explica la regresioacuten sum(Y ˆ Ϫ Y ෆ )2 y la parte no explicada de la variacioacutensum(Y Ϫ Y ˆ )2 La figura 13-4 es un duplicado de la figura 12-15 Sirve como repaso de la relacioacuten etre la desviacioacuten total la desviacioacuten explicada y la desviacioacuten no explicada para un solo dato en uregresioacuten simple Aunque no podamos dibujar una figura similar para una regresioacuten muacuteltiple coceptualmente estamos haciendo lo mismo

Al analizar la variacioacuten en Y fijamos nuestra atencioacuten en tres teacuterminos diferentes cada uno de cuales es una suma de cuadrados Los denotamos con

Suma de cuadradosy sus grados delibertad

Anaacutelisis de lavariacioacuten de losvalores Y

FIGURA 13-4

Desviacioacuten totaldesviacioacutenexplicada ydesviacioacuten noexplicada paraun valor observadode Y

Y

X

Un valor observado de lavariable dependiente (Y )

R e c t a d

e r e g r e s

i oacute n

Desviacioacuten no explicada de esta Y respectoa su media Y

(Y ndash Y )^

Desviacioacuten explicada deesta Y respecto a su media Y

(Y ndash Y )^Y

Valor estimado de esta Y

a partir de la recta de regresioacuten (Y )^

Desviacioacuten total de esta Y

respecto a su media Y

(Y ndash Y )

Tres sumas de cuadrados

SCT ϭ suma de cuadrados total (es decir la parte explicada) ϭ sum(Y Ϫ Y ෆ )2

SCR ϭ suma de cuadrados de la regresioacuten (es decir la parte explicada) ϭ sum(Y ˆ Ϫ Y ෆ )2 [13-10

SCE ϭ suma de cuadrados del error (es decir la parte no explicada) ϭ sum(Y Ϫ Y ˆ )2

Estaacuten relacionadas por la ecuacioacuten

que dice que la variacioacuten total en Y puede dividirse en dos partes la parte explicada y la no explicaCada una de estas sumas de cuadrados tiene un nuacutemero asociado de grados de libertad SCT t

ne n Ϫ 1 grados de libertad (n observaciones menos un grado de libertad debido a que la media la muestra estaacute fija) SCR tiene k grados de libertad porque existen k variables independientes qse utilizaron para explicar Y Finalmente SCE tiene n Ϫ k Ϫ 1 grados de libertad porque utilizamnuestras n observaciones para estimar k ϩ 1 constantes a b1 b2 bk Si la hipoacutetesis nula es ci

ta el cociente

Descomposicioacuten de la variacioacuten total de Y

SCT ϭ SCR ϩ SCE [13-1

Cociente F

F ϭ [13-12SCR k ᎏᎏ

SCE(n ndash k ndash 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2456

tiene una distribucioacuten F con k grados de libertad en el numerador y n Ϫ k Ϫ 1 grados de libel denominador Si la hipoacutetesis nula es falsa entonces el cociente tiende a ser maacutes grande qula hipoacutetesis nula es verdadera De modo que si el cociente F es demasiado grande (seguacuten lo na el nivel de significancia de la prueba y el valor apropiado de la tabla 6 del apeacutendice) rechH0 y concluimos que la regresioacuten como un todo es significativa

La figura 13-5 presenta la salida de Minitab para el problema del IRS Esta parte del rincluye los cocientes F calculados para la regresioacuten en ocasiones llamado anaacutelisis de v

(ANOVA) para la regresioacuten Probablemente se pregunte si esto tiene algo que ver con el anaacutelisrianza que estudiamos en el capiacutetulo 11 La respuesta es siacute Aunque no lo hicimos es posibletrar que el anaacutelisis de varianza visto en el capiacutetulo 11 tambieacuten contempla la variacioacuten total las observaciones alrededor de la gran media y la divide en dos partes una explicada por lascias entre los distintos grupos (que corresponde a lo que llamamos varianza entre columnas)

no explicada por dichas diferencias (que corresponde a la varianza dentro de columnas) Estcisamente anaacutelogo a lo que acabamos de hacer en la ecuacioacuten 13-11Para el problema del IRS vemos que SCR ϭ 29109 (con k ϭ 3 grados de libertad) SCE

(con n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad) y que

F ϭ ϭ ϭ 11833

Los elementos en la columna ldquoMCrdquo son justo las sumas de cuadrados divididas entre sus glibertad Para 3 grados de libertad en el numerador y 6 en el denominador la tabla 6 del apeacutence que 978 es el liacutemite superior de la regioacuten de aceptacioacuten para un nivel de significancia El valor calculado de F 11833 estaacute muy por arriba de 978 de manera que se ve que la r

como un todo es altamente significativa Se puede llegar a la misma conclusioacuten si se observresultado del programa dice que ldquo prdquo es 0000 Debido a que este valor prob es menor que elsignificancia ϭ 001 se concluye que la regresioacuten completa es significativa De esta mapuede usar la p de ANOVA como prueba sin tener que utilizar la tabla 6 del apeacutendice para bvalor criacutetico de F Esto es anaacutelogo a la manera en que se usaron los valores de p en la figura ra probar la significancia de las variables explicativas individuales

Multicolinealidad en la regresioacuten muacuteltiple

En el anaacutelisis de regresioacuten muacuteltiple los coeficientes de regresioacuten a menudo se vuelven

confiables conforme aumenta el grado de correlacioacuten entre las variables independie

existe un alto nivel de correlacioacuten entre algunas de las variables independientes nos enfrenun problema que los estadiacutesticos llaman multicolinealidad

La multicolinealidad puede presentarse si deseamos estimar la recuperacioacuten de las ventaempresa y utilizamos tanto el nuacutemero de vendedores empleados como sus salarios totales Cvalores asociados con estas dos variables independientes tienen una correlacioacuten alta neceusar soacutelo un conjunto de ellos para realizar nuestra estimacioacuten De hecho al agregar una segriable que estaacute correlacionada con la primera se distorsionan los valores de los coeficientgresioacuten Sin embargo a menudo podemos predecir bien Y incluso cuando haya multicoline

Consideremos un ejemplo donde existe multicolinealidad para ver coacutemo afecta a la regresrante los 12 meses pasados el gerente del restaurante Pizza Shack ha estado poniendo unaanuncios en el perioacutedico local Los anuncios se programan y pagan el mes anterior a que ap

Un ejemplo demulticolinealidad

Definicioacuten y efecto dela multicolinealidad

9703ᎏ

0082

29109 3ᎏ

0491 6Prueba de lasignificancia de laregresioacuten en elproblema del Serviciode Contribuciones

Anaacutelisis devarianza parala regresioacuten

Prueba F de laregresioacuten como

un todo

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 29 1088 9 7029 118 52 0Er r or 6 0 4912 0 0819Tot al 9 29 6000

FIGURA 13-5Salida de Minitabanaacutelisis devarianza

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2556

Cada anuncio contiene un cupoacuten que permite llevarse dos pizzas pagando solamente la de mcio El gerente recolectoacute los datos de la tabla 13-4 y le gustariacutea utilizarlos para predecir las vpizzas

En las figuras 13-6 y 13-7 se dieron los resultados de Minitab para las regresiones respelas ventas totales sobre el nuacutemero de anuncios y sobre el costo

Para la regresioacuten sobre el nuacutemero de anuncios tenemos que el valor t observado es 395grados de libertad y un nivel de significancia de ϭ 001 se encontroacute que el valor t criacuteticdo de la tabla 2 del apeacutendice) es 3169 Como t o Ͼ t c (o de manera equivalente como p es m001) concluimos que el nuacutemero de anuncios es una variable explicativa altamente signifilas ventas totales Note tambieacuten que r 2 ϭ 610 de modo que el nuacutemero de anuncios explximadamente el 61 de la variacioacuten en las ventas de pizzas

Para la regresioacuten sobre el costo de los anuncios el valor t observado es 454 de modo qude los anuncios es una variable explicativa de las ventas totales todaviacutea maacutes significativa que ro de anuncios (para los que el valor t observado fue soacutelo 395) En esta regresioacuten r 2 ϭ 673

el costo de los anuncios explica aproximadamente el 67 de la variacioacuten de las ventas de pizComo ambas variables explicativas son altamente significativas por siacute mismas intentam

zar ambas en una regresioacuten muacuteltiple El resultado se presenta en la figura 13-8La regresioacuten muacuteltiple es altamente significativa como un todo ya que la p de ANOVA e

Uso de ambas varia-bles explicativas enuna regresioacuten muacuteltiple

Dos regresionessimples

Datos de ventas y anun-cios para el restaurantePizza Shack

Tabla 13-4 X 1 X 2 Y

Nuacutemero Costo de anuncios Venta tode anuncios publicados de pizz

Mes publicados (cientos de doacutelares) (miles de d

Mayo 12 139 436

Junio 11 120 380

Julio 9 93 301

Agosto 7 97 353

Septiembre 12 123 464

Octubre 8 114 342

Noviembre 6 93 302

Diciembre 13 143 407

Enero 8 102 385

Febrero 6 84 226

Marzo 8 112 376

Abril 10 111 352

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esVENTAS = 16 9 + 2 08 ANUNCI OS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 16 937 4 982 3 40 0 007ANUNCI OS 2 0832 0 5271 3 95 0 003

s = 4 206 R- s q = 61 0

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 1 276 31 276 31 15 62 Er r or 10 176 88 17 69Tot a l 11 453 19

Figura 13-6

Regresioacuten de lasventas sobre elnuacutemero deanuncios conMinitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2656

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2756

gar el nuacutemero de anuncios como segunda variable explicativa ademaacutes del costo de los anuncios eplica nada maacutes alrededor del 1 adicional de la variacioacuten de las ventas totales

En este punto es justo preguntarse iquestqueacute variable realmente explica la variacioacuten de las ventotales en la regresioacuten muacuteltiple La respuesta es que ambas la explican pero no podemos separ

sus contribuciones individuales debido a que estaacuten altamente correlacionadas entre siacute E

consecuencia sus coeficientes en la regresioacuten muacuteltiple tienen errores estaacutendar altos valore

calculados relativamente bajos y valores prob Ͼ | t | relativamente altos

iquestDe queacute manera nos afecta esta multicolinealidad Todaviacutea podemos hacer predicciones relativmente precisas cuando se encuentra presente note que para la regresioacuten muacuteltiple (la salida se dala figura 13-8) el error estaacutendar de la estimacioacuten que determina el ancho de los intervalos de co

fianza para las predicciones es 3989 mientras que para la regresioacuten simple con el costo de los anucios como variable explicativa (salida en la figura 13-7) tenemos se ϭ 3849 Lo que no podemhacer es predecir con mucha precisioacuten coacutemo cambiaraacuten las ventas si aumentamos en uno el nuacutemede anuncios La regresioacuten muacuteltiple dice que b1 ϭ 0625 (esto es cada anuncio aumenta las ventotales de pizzas alrededor de $625) pero el error estaacutendar de este coeficiente es 112 (es decir apximadamente $1120)

Las contribucionesindividuales nopueden separarse

Ejercicios 134

Ejercicios de autoevaluacioacuten

EA 13-4 Edith Pratt es una ocupada ejecutiva de una compantildeiacutea de transporte de carga a nivel nacional y va tara una junta porque no encuentra la salida de la regresioacuten muacuteltiple elaborada por un asistente Si la regsioacuten total es significativa al nivel 005 ella desea usar las salida de computadora como evidencia para fudamentar algunas ideas que expondraacute en la reunioacuten Sin embargo su ayudante estaacute enfermo De hectoda la informacioacuten que tiene de la regresioacuten muacuteltiple es un trozo de papel con los siguientes datos

Regresioacuten paraEdith Pratt

SCR 8724 con gl

SCE con 17 gl

SCT 10236 con 24 gl

Como el papel ni siquiera tiene todos los nuacutemeros Edith ha concluido que no es uacutetil Usted sin embardebe saber maacutes que ella iquestPuede Edith entrar en la junta o debe seguir buscando la salida de computador

EA 13-5 Una pequentildea liacutenea aeacuterea de Nueva Inglaterra realizoacute una encuesta sobre sus 15 terminales y obtuvo losguientes datos para el mes de febrero donde

VENTAS ϭ ingreso total seguacuten el nuacutemero de boletos vendidos (en miles de doacutelares)

PROMOCϭ cantidad gastada en promociones de la liacutenea aeacuterea en el aacuterea (en miles de doacutelares)

COMPET ϭ nuacutemero de liacuteneas aeacutereas que compiten en esa terminal

GRATIS ϭ nuacutemero de pasajeros que vuelan gratis (por diferentes razones)

Sugerencia el concepto de hacer infe-rencias respecto a una regresioacuten muacutelti-ple es justo lo mismo que se hizo en elcapiacutetulo 12 cuando hicimos inferencias

respecto a una recta de regresioacuten excepto que ahora se em-

plean dos o maacutes variables independientes Advertencia lamulticolinealidad es un problema que debe manejarse enla regresioacuten muacuteltiple y es necesario desarrollar una com-prensioacuten con sentido comuacuten Recuerde que todaviacutea puedehacer predicciones precisas cuando estaacute presente Pero re-cuerde tambieacuten que no puede decir con mucha precisioacuten

cuaacutento cambiaraacute la variable dependiente si ldquomanipulardquo lavariables independientes Entonces el objetivo debe seminimizar la multicolinealidad Sugerencia la mejor regresioacuten muacuteltiple es la que explica la relacioacuten entre los datos asentildealar la responsabilidad de la mayor proporcioacuten de la va

riacioacuten en la variable dependiente con el menor nuacutemero dvariables independientes Advertencia no es una buenidea incluir demasiadas variables independientes soacutelo porque cuenta con una computadora y un paquete de softwarpara estadiacutestica

SUGERENCIAS

Y

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2856

Ventas (doacutelares) Promoc (doacutelares) Compet Gratis

793 25 10 3

2001 55 8 6

1632 60 12 9

2001 79 7 16

1460 52 8 15

1777 76 12 9

309 20 12 8

2919 90 5 10

1600 40 8 43394 96 5 16

1596 55 11 7

863 30 12 6

2375 60 6 10

1072 50 10 4

1550 35 10 4

a) Utilice la siguiente salida de Minitab para determinar la ecuacioacuten de regresioacuten que mejor se ara la liacutenea aeacuterea

La ec uaci oacuten de r egr es i oacuten esVENTAS ϭ 172 ϩ 25 9 PROMOVϪ 13 2 COMPET Ϫ 3 04 GRATI S

Pr onos t i cador Coef Des vEs t Coci ent e - t Cons t ant e 172 34 51 38 3 35 0PROMOV 25 950 4 877 5 32 0COMPET - 13 238 3 686 - 3 59 0GRATI S - 3 041 2 342 - 1 30 0

b) iquestLos pasajeros que vuelan gratis ocasionan una disminucioacuten significativa en las ventas Fpruebe las hipoacutetesis apropiadas Use ϭ 005

c) iquestUn incremento de $1000 en las promociones cambia las ventas en $28000 o el cambio ecativamente diferente de $28000 Formule y pruebe las hipoacutetesis adecuadas Use ϭ 010

d) Calcule un intervalo de confianza del 90 para el coeficiente de la pendiente de la COMPET

Aplicaciones

13-22 Mark Lowtown publica el perioacutedico Mosquito Junction Enquirer y tiene problemas para predectidad de papel perioacutedico que necesita imprimir diariamente Eligioacute aleatoriamente 27 diacuteas del arior y registroacute la siguiente informacioacuten

PESO ϭ peso en libras de papel perioacutedico para la edicioacuten de ese diacutea

CLASIFICADOS ϭ nuacutemero de anuncios clasificados

PUBLICIDAD ϭ nuacutemero de anuncios publicitarios

PLANA COMPLETA ϭ nuacutemero de anuncios a una plana

Utilizando Minitab para hacer una regresioacuten de PESO sobre las otras tres variables Mark obtuguiente salida

Pr onos t i cador Coef Des vEs t Coci ent e- t Cons t ant e 1072 95 872 43 1 23 0CLASI FI CADOS 0 251 0 126 1 99 0PUBLI CI DAD 1 250 0 884 1 41 0PLANA COMPLETA 250 66 67 92 3 69 0

a) Mark siempre ha pensado que cada anuncio publicitario utiliza al menos 3 libras de papel iquestsioacuten le da una razoacuten significativa para dudar esto al nivel del 5

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2956

b) De manera similar Mark siempre ha creiacutedo que cada anuncio clasificado utiliza aproximmedia libra de papel iquestTiene ahora Mark una razoacuten significativa para dudar esto al nivel del

c) Mark vende espacios de anuncios de plana completa a los comerciantes locales a $30 la paacutegberaacute pensar en ajustar sus tarifas si el papel perioacutedico le cuesta $009 por libra Suponga costos son despreciables Establezca expliacutecitamente las hipoacutetesis y una conclusioacuten (Sugere

jando todo lo demaacutes constante cada anuncio adicional de plana completa tiene un costo de bras de papel ϫ $009 por libra ϭ $2256 El punto de equilibrio es 333333 libras iquestPor quel coeficiente de pendiente para PLANA COMPLETA es significativamente mayor que Mark no estaacute obteniendo ganancias y debe cambiar sus tarifas)

13-23 Para los datos del ejercicio 13-18 y un nivel de significancia de 010 iquestcuaacuteles variables son sign

mente explicativas de los resultados de los exaacutemenes (Habiacutea 12 estudiantes en la muestra) 13-24 Para los datos del ejercicio 13-18 y la siguiente salida de Minitab del procedimiento de regresiple hecho por Bill

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 3134 42 783 60Er r or 7 951 25 135 89Tot a l 11 4085 67

a) iquestCuaacutel es el valor observado de F b) A un nivel de significancia de 005 iquestcuaacutel es el valor criacutetico de F que se debe utilizar para d

si la regresioacuten como un todo es significativac) Basaacutendose en las respuestas a los incisos a) y b) iquestes la regresioacuten significativa como un tod

13-25 Remiacutetase al ejercicio 13-19 A un nivel de significancia de 001 iquestes la variable DISTANCIA uble explicativa significativa para VENTAS

13-26 Para los datos del ejercicio 13-19 y la siguiente salida adicional de Minitab al correr la regresioacuten

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 2861495 715374 102 39 0Er r or 18 125761 6896 7Tot a l 22 2987256

Al nivel de significancia de 005 iquestes la regresioacuten significativa como un todo

13-27 Henry Lander es el director de produccioacuten de la Alecos Corporation de Caracas Venezuela Hede que le ayude a determinar una foacutermula para predecir el ausentismo de los empacadores de chipoacutetesis es que la temperatura diaria promedio puede explicar el porcentaje de ausentismo Durios meses reuacutene datos ejecuta el procedimiento de regresioacuten simple y encuentra que la tempeplica 66 de la variacioacuten en el ausentismo Pero Henry no estaacute convencido de que eacuteste sea un cador satisfactorio Sugiere que la precipitacioacuten pluvial diaria podriacutea tambieacuten tener algo que vausentismo de modo que registra los datos correspondientes y hace una regresioacuten del ausentismte el tiempo de lluvias y obtiene un valor R2 de 059 ldquoiexclEurekardquo grita usted ldquoiexclLo tengo Con uticador que explica 66 y otro que explica 59 todo lo que tengo que hacer es una regresioacutenutilizando ambos y seguramente tendreacute un pronosticador casi perfectordquo Para su desaacutenimo sin la regresioacuten muacuteltiple tiene una R

2 de soacutelo 68 que es solamente un poco mejor que la variablperatura sola iquestCoacutemo puede explicar esta aparente discrepancia

13-28 Juan Armenlegg administrador de Rockyrsquos Diamond y Jewelry Store estaacute interesado en desamodelo para estimar la demanda del consumidor para su costosa mercanciacutea Como la mayoriacutea de

tes compran diamantes y joyas a creacutedito Juan estaacute seguro de que dos factores que deben influirmanda de los clientes son la tasa real de inflacioacuten anual y la tasa real de intereses sobre preacutestamprincipales bancos del paiacutes Explique algunos problemas que Juan podriacutea encontrar si fuera a dun modelo de regresioacuten basado en estas dos variables de prediccioacuten

13-29 Un nuevo programa de juegos Check That Model pide a los concursantes que especifiquen el nuacutenimo de paraacutemetros que necesitan para determinar si un modelo de regresioacuten muacuteltiple es signifimo un todo para ϭ 001 Usted ganoacute la apuesta con 4 paraacutemetros Use la siguiente informacioacutenterminar si la regresioacuten es significativa

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3056

R 2

ϭ 07452

SCE ϭ 1254

n ϭ 18

Nuacutemero de variables independientes ϭ 3

13-30 La Scottish Turist Agency estaacute interesada en el nuacutemero de turistas que entran al paiacutes cada semanrante la temporada alta Se recolectaron los siguientes datos

Turistas (Y ) ϭ nuacutemero de turistas que entran a Escocia en una semana (en miles)

Cambio (X 1)ϭ nuacutemero de libras escocesas compradas por $1 doacutelar

Precio (X 2) ϭ nuacutemero de libras escocesas cobradas por viaje redondo en camioacuten de Londres a Edimburgo

Promoc (X 3) ϭ cantidad gastada en promocioacuten del paiacutes (en miles de libras escocesas)Temp (X 4) ϭ temperatura media durante la semana en Edimburgo (en grados Celsius)

Turistas (Y ) Cambio (X 1) Precio (X 2) Promoc (X 3) Temp (X 4)

69 061 40 87 154

71 059 40 88 156

68 063 40 85 154

79 061 35 86 153

76 060 35 94 158

82 065 35 99 162

80 058 35 98 164

84 059 35 102 166

97 061 30 114 174

98 062 30 116 172

72 057 40 84 176

67 055 40 86 164

a) Utilice el paquete de software que tenga para determinar la ecuacioacuten de regresioacuten que mejote a los datos de la agencia de turismo

b) iquestEs la tasa de cambio una variable explicativa significativa Establezca y pruebe las hipoacutetesidas a un nivel de significancia de 010

c) Un incremento de 1000 libras en las promociones iquestaumenta el nuacutemero de turistas en maacutesEstablezca y pruebe las hipoacutetesis adecuadas para un nivel de significancia de 005

d) Calcule un intervalo de confianza del 95 para el coeficiente de la pendiente de Temp

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-4 Como SCT ϭ SCR ϩ SCE SCE ϭ SCT Ϫ SCR ϭ 10236 Ϫ 8724 ϭ 1512Como gl SCT ϭ gl SCR ϩ gl SCE gl SCR ϭ gl SCT Ϫ gl SCE ϭ 24 Ϫ 17 ϭ 7

Entonces F ϭ ϭ ϭ 1401

F CRiacuteT ϭ F (7 17 005) ϭ 261Como F OBS gt F CRIacuteT se concluye que la regresioacuten es significativa como un todo Edith debe conticando la salida de computadora de la regresioacuten para usarla en la junta

EA 13-5 De la salida de computadora se obti enen los siguientes resultadosa) VENTAS ϭ 17234 ϩ 25950PROMOC Ϫ13238COMPET Ϫ 3041GRATISb) H0 BGRATIS ϭ 0 H1 BGRATIS Ͻ 0 ϭ 005

Eacutesta es una prueba de una cola y el valor prob en los resultados es para la alternativa de dos c BGRATIS 0 De manera que para esta prueba el valor prob es 02212 ϭ 0111 Ͼ ϭ 00que no se puede rechazar H0 las ventas no disminuyen significativamente cuando aumenta ro de pasajeros que vuelan gratis

c) H0 BPROMOC ϭ 28 H1 BPROMOC 28 ϭ 010

87247ᎏᎏ

151217SCRk ᎏᎏ

SCE(n Ϫ k Ϫ 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3156

El valor observado t de los resultados de regresioacuten es

ϭ ϭ Ϫ0420

Con 11 grados de libertad y ϭ 010 en ambas colas combinadas los valores criacuteticos t parba son Ϯ1796 asiacute el valor observado estaacute dentro de la regioacuten de aceptacioacuten No se rechacambio en VENTAS para un incremento de una unidad ($1000) en PROMOC no es significate diferente de 28 ($28000)

d) Con 11 grados de libertad el valor t para un intervalo del 90 de confianza es 1796 por lo

tervalo esbCOMP Ϯ 1796sbCOMP

ϭ Ϫ13238 Ϯ 1796(3686)

ϭ Ϫ13238 Ϯ 6620 ϭ (Ϫ19858 Ϫ 6618)

La liacutenea aeacuterea puede tener una seguridad del 90 de que el ingreso por los boletos en una ofminuye entre $6600 y $19900 aproximadamente con cada liacutenea aeacuterea adicional que comp

135 Teacutecnicas de modelado

Dada una variable que deseamos explicar y un conjunto de variables explicativas potencialehaya varias ecuaciones de regresioacuten diferentes que podamos estudiar dependiendo de queacute explicativas incluyamos y de coacutemo lo hagamos Cada una de esas ecuaciones de regresioacutence como modelo Las teacutecnicas de modelado son las distintas formas en que podemos incluriables explicativas y verificar queacute tan apropiados son los modelos de regresioacuten Existen municas de modelado diferentes pero soacutelo veremos dos de las maacutes utilizadas

Datos cualitativos y variables ficticias

En todos los ejemplos de regresioacuten que hemos visto hasta ahora los datos manejados hanmeacutericos o cuantitativos Pero ocasionalmente nos enfrentaremos con una variable categoacuterilitativa En el problema del inicio el capiacutetulo el director de personal desea ver si el salarioun vendedor depende de su sexo En la tabla 13-5 repetimos los datos de dicho problema

Por el momento ignore la antiguumledad y utilice la teacutecnica desarrollada en el capiacutetulo 9 bar la diferencia entre las medias de dos poblaciones para ver si los hombres ganan maacutes qu

jeres Pruebe con ϭ 001 Si tomamos a los hombres como la poblacioacuten 1 y a las mujerespoblacioacuten 2 probaremos las siguientes hipoacutetesis

H0 1 ϭ 2 larr Hipoacutetesis nula no existe discriminacioacuten por sexo en los salarios base

H1 1 Ͼ 2 larr Hipoacutetesis alternativa se discrimina a las mujeres en su salario base

ϭ 001 larr Nivel de significancia

Revisioacuten del enfoqueanterior del problema

Buacutesqueda dediferentes modelos

25950 Ϫ 28ᎏᎏ

4877

(bPROMOC Ϫ 28)ᎏᎏ

sbPROMOC

Datos para el problemade discriminacioacuten porsexo

Tabla 13-5 Vendedores VendedorasAntiguumledad Salario base Antiguumledad Salario base(en meses) (en miles) (en meses) (en miles)

6 75 5 62

10 86 13 87

12 91 15 94

18 103 21 98

30 130

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3256

A continuacioacuten bosquejamos el anaacutelisis Si tiene problemas para seguirlo deberaacute repasamente la seccioacuten 93

n1 ϭ 5 n2 ϭ 4

x ෆ1 ϭ 97 x ෆ2 ϭ 8525

s2

1 ϭ 4415 s2

2 ϭ 2609

s2

p ϭ

ϭ

ϭ 3641

x ෆ1Ϫ x

ෆ2ϭ s pΊ ϩ

ϭ 128

t ϭ

ϭ

ϭ 092

Con siete grados de libertad el valor t criacutetico para una prueba de cola superior con ϭ 001 eComo el valor t observado de 092 es menor que 2998 no podemos rechazar H0

Entonces el anaacutelisis concluye que no parece haber discriminacioacuten por sexo en los salarPero recuerde que hasta ahora se han ignorado los datos de antiguumledad laboral para el anaacuteli

Antes de seguir vea el diagrama de dispersioacuten de los datos En la figura 13-9 los punto

corresponden a los hombres y los blancos a las mujeres El diagrama de dispersioacuten muestraridad que el salario base aumenta con los antildeos de antiguumledad pero si con la mirada sigue lo qla recta de regresioacuten notaraacute que los puntos negros tienden a estar arriba de ella y los blancos

La figura 13-10 da la salida de una regresioacuten del salario base sobre los meses de antiguumlelos resultados se ve que la antiguumledad es una variable explicativa altamente significativa

Ademaacutes r 2

ϭ 926 que indica que la variable meses de antiguumledad explica cerca del 9variacioacuten en el salario base La figura 13-11 contiene parte de la salida que no se vio antesbla de residuos Para cada punto el residuo es simplemente Y Ϫ Y ˆ que se reconoce como el

Una ldquomiradardquo a los

datos

El enfoque anterior nodetecta discriminacioacuten

(97 ndash 8525) ndash 0ᎏᎏ

128

( x ෆ1 ndash x ෆ2) ndash (1 Ϫ 2)H0

ᎏᎏᎏ

ˆ x ෆ1Ϫ

x ෆ2

1ᎏ

n2

1ᎏ

n1

4(4415) ϩ 3(2609)ᎏᎏᎏ5 ϩ 4 ndash 2

(n1 ndash 1)s21 ϩ (n2 ndash 1)s22ᎏᎏᎏ

n1 ϩ n2 ndash 2

FIGURA 13-9

Diagrama de dis-persioacuten de salariosbase contra mesesde antiguumledad

4 8 12 16 20 24 28

4

8

12

Meses de antiguumledad

S a l a r i o ( m i l e s d e d oacute l a r e s )

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3356

el ajuste de la recta de regresioacuten en ese punto En la figura 13-11 AJUST1 son los valores y RESI1 son los residuos

Tal vez la parte maacutes importante del anaacutelisis del resultado de una regresioacuten sea estusiduos Si la regresioacuten incluye todos los factores explicativos relevantes estos residuo

ser aleatorios Dicho de otro modo si los residuos muestran cualquier patroacuten no aleat

to indica que hay algo sistemaacutetico que afecta el proceso y que no hemos tomado en cu

manera que buscamos patrones en los residuos o para decirlo de forma maacutes pintoresca ldquopmos a los residuos hasta hacerlos hablarrdquo

Si observamos los residuos presentados en la figura 13-11 vemos que los primeros cincoson positivos De modo que para los vendedores tenemos Y ndash Y ˆ Ͼ 0 o Y Ͼ Y ˆ es decir laregresioacuten cae abajo de estos cinco puntos Tres de los cuatro uacuteltimos residuos son negaticonsiguiente para las vendedoras tenemos Y Ϫ Y ˆ Ͻ 0 o Y Ͻ Y ˆ asiacute que la recta de regresicuentra arriba de tres de los cuatro puntos Esto confirma lo que vimos al observar el diagdispersioacuten de la figura 13-9 Este patroacuten no aleatorio en los residuos sugiere que el sexo siacute etor determinante del salario base

iquestCoacutemo podemos incorporar el sexo de los vendedores dentro del modelo de regresioacutencemos utilizando un dispositivo llamado variable ficticia (o variable indicadora) Para lpuntos que representan a los vendedores esta variable tiene valor de 0 y para los cuatro purepresentan a las vendedoras valdraacute 1 Los datos de entrada para nuestra regresioacuten con variticias se dan en la tabla 13-6

Para los datos de la tabla 13-6 se ajusta una regresioacuten de la forma

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

Uso de variablesficticias

Deteccioacuten depatrones en losresiduos

ldquoPresionar a losresiduosrdquo

Anaacutel i s i s de r e gr e s i oacuten

La ec uac i oacuten de r e gr es i oacuten esSALARI O ϭ 5 81 ϩ 0 233 MESES

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t pCons t a nt e 5 8093 0 4038 14 39 0 000MESES 0 23320 0 02492 9 36 0 000

s ϭ 0 5494 R- s q ϭ 92 6

Anaacute l i s i s de va r i a nz aFUENTE GL SC MC F Re gr e s i oacuten 1 26 443 24 443 87 61 0Er r or 7 2 113 0 302Tot a l 8 28 556

FIGURA 13-10

Regresioacuten conMinitab del salariobase sobre losmeses deantiguumledad

RENGLOacuteN SALARI O AJ UST1 RESI 1

1 7 5 7 2085 0 2914992 8 6 8 1413 0 458684

3 9 1 8 6077 0 4922764 10 3 10 0069 0 2930545 13 0 12 8054 0 1946076 6 2 6 9753 - 0 7752977 8 7 8 8409 - 0 1409288 9 4 9 3073 0 0926649 9 8 10 7066 - 0 906558

FIGURA 13-11

Tabla de residuosde Minitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 756

Ejercicios 132

Ejercicios de autoevaluacioacutenEA 13-1 Dado el siguiente conjunto de datos

a) Calcule el plano de regresioacuten muacuteltipleb) Prediga Y cuando X 1 ϭ 30 y X 2 ϭ 27

Y X 1 X 2

25 35 50

30 67 4211 15 85

22 03 14

27 46 36

19 20 13

EA 13-2 Se ha reunido la siguiente informacioacuten de una muestra aleatoria de arrendadores de departamentos en uciudad Se intenta predecir la renta (en doacutelares por mes) con base en el tamantildeo del departamento (nuacutemro de habitaciones) y la distancia al centro de la ciudad (en millas)

Renta Nuacutemero de Distancia(doacutelares) habitaciones al centro

360 2 1

1000 6 1450 3 2

525 4 3

350 2 10

300 1 4

a) Calcule la ecuacioacuten de miacutenimos cuadrados que relacione mejor estas tres variablesb) Si alguien busca un departamento de dos habitaciones a 2 millas del centro iquestqueacute renta debe esperar pag

Conceptos baacutesicos 13-7 Dado el siguiente conjunto de datos

a) Calcule el plano de regresioacuten muacuteltipleb) Pronostique Y cuando X 1 ϭ 105 y X 2 ϭ 136

Y X 1 X 2

114 45 132

166 87 187

205 126 198

294 197 254

76 29 228

138 67 178

285 174 146

13-8 Para el siguiente conjunto de datosa) Calcule el plano de regresioacuten muacuteltipleb) Prediga Y cuando X 1 ϭ 28 y X 2 ϭ 10

Y X 1 X 2

10 8 4

17 21 9

18 14 11

26 17 20

35 36 13

8 9 28

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 856

13-9 Dado el siguiente conjunto de datosa) Calcule el plano de regresioacuten muacuteltipleb) Pronostique Y cuando X 1 ϭ Ϫ1 y X 2 ϭ 4

Y X 1 X 2

6 1 3

10 3 Ϫ1

9 2 4

14 Ϫ2 7

7 3 2

5 6 Ϫ4

Aplicaciones

13-10 Sam Spade duentildeo y gerente general de Stationery Store estaacute preocupado por el comportamienventas de un modelo de reproductor de CD y casetes que se venden en la tienda Se da cuenta de ten muchos factores que podriacutean ayudar a explicarlo pero cree que la publicidad y el precio soncipales determinantes Sam reunioacute los siguientes datos

Ventas Publicidad Precio(unidades vend) (nuacutem de anuncios) (doacutelares)

33 3 125

61 6 115

70 10 140

82 13 130

17 9 145

24 6 140

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir las ventas a partir de la publicidad y b) Si la publicidad es 7 y el precio es $132 iquestqueacute ventas podriacutea pronosticar

13-11 Un productor de comida para cerdos desea determinar queacute relacioacuten existe entre la edad de un cerdo empieza a recibir un complemento alimenticio de reciente creacioacuten el peso inicial del anima

mento de peso en un periodo de una semana con el complemento alimenticio La siguiente infoes resultado de un estudio de ocho lechones

X 1 X 2 Y

Nuacutemero Peso inicial Edad inicial Aumentode lechoacuten (libras) (semanas) de peso

1 39 8 7

2 52 6 6

3 49 7 8

4 46 12 10

5 61 9 9

6 35 6 5

7 25 7 38 55 4 4

a) Calcule la ecuacioacuten de miacutenimos cuadrados que mejor describa estas tres variablesb) iquestCuaacutento podemos esperar que un cerdo aumente de peso en una semana con el complemento

ticio si teniacutea nueve semanas de edad y pesaba 48 libras 13-12 Una estudiante graduada que quiere comprar un auto Neptune usado investigoacute los precios Pien

antildeo del modelo y el nuacutemero de millas recorridas influyen en el precio de compra Los datos siguirresponden a 10 autos con precio (Y ) en miles de doacutelares antildeo ( X 1) y millas recorridas ( X 2) en ma) Encuentre (calcule) la ecuacioacuten de miacutenimos cuadrados que mejor relacione estas tres variabb) La estudiante desea comprar un Neptune 1991 con alrededor de 40000 millas recorridas

pronostica que pagaraacute

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 956

(Y ) X 2

Precio X 1 Millas(miles de doacutelares) Antildeo (miles)

299 1987 556

602 1992 184

887 1993 213

392 1988 469

955 1994 118

905 1991 364

937 1992 282

42 1988 44248 1989 349

574 1991 264

13-13 La Reserva Federal de Estados Unidos realiza un estudio preliminar para determinar la relacioacuten etos indicadores econoacutemicos y el cambio porcentual anual en el producto interno bruto (PIB) Dindicadores examinados son el monto del deacuteficit del gobierno federal (en miles de millones de del promedio industrial Dow Jones (el valor medio del antildeo) Los datos correspondientes a seis antilde

Y X 1 X 2

Cambio en el PIB Deacuteficit federal Dow Jones

25 100 2850

Ϫ10 400 2100

40 120 330010 200 2400

15 180 2550

30 80 2700

a) Encuentre (calcule) la ecuacioacuten de miacutenimos cuadrados que mejor describa los datosb) iquestQueacute porcentaje de cambio en el PIB se esperariacutea en un antildeo en el cual el deacuteficit federal fue

millones de doacutelares y el promedio Dow Jones fue 3000

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-1 a) Y X 1 X 2 X 1Y X 2Y X 1X 2 X 2

1 X 2

2

25 35 50 875 1250 175 1225 2500

30 67 42 2010 1260 2814 4489 1764

11 15 85 165 935 1275 225 7225

22 03 14 66 308 042 009 196

27 46 36 1242 972 1656 2116 1296

19 20 13 380 247 260 400 169

1 ෆ3 ෆ4 ෆ 1 ෆ8 ෆ ෆ6 ෆ 2 ෆ4 ෆ ෆ0 ෆ 4 ෆ7 ෆ3 ෆ ෆ8 ෆ 4 ෆ9 ෆ7 ෆ ෆ2 ෆ 7 ෆ7 ෆ ෆ9 ෆ7 ෆ 8 ෆ4 ෆ ෆ6 ෆ4 ෆ 1 ෆ3 ෆ1 ෆ ෆ5 ෆ0 ෆ

Las ecuaciones 13-2 13-3 y 13-4 se convierten en

Y ϭ na ϩ b1 X 1 ϩ b2 X 2 134 ϭ 6 a ϩ 186b1 ϩ 240 b2

X 1Y ϭ a X 1 ϩ b1 X 21 ϩb2 X 1 X 2 4738 ϭ 186a ϩ 8464b1 ϩ 7797b2

X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22 4972 ϭ 240a ϩ 7797b1 ϩ 13150b2

Al resolver estas ecuaciones de manera simultaacutenea se obtiene

a ϭ 203916 b1 ϭ 23403 b2 ϭ Ϫ13283

De modo que la ecuacioacuten de regresioacuten es Y ˆ ϭ 203916 ϩ 23403 X 1 Ϫ 13283 X 2b) Con X 1 ϭ 30 y X 2 ϭ 27

Y ˆ = 203916 ϩ 23403(30) Ϫ 13283(27) ϭ 2883

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1056

EA 13-2 a) En este problema Y ϭ renta X 1 ϭ nuacutemero de habitaciones X 2 ϭ distancia al centro

Y X 1 X 2 X 1Y X 2Y X 1X 2 X 2

1 X 2

2 Y 2

360 2 1 720 360 2 4 1 129600

1000 6 1 600 1000 6 36 1 1000000

450 3 2 1350 900 6 9 4 202500

525 4 3 2100 1575 12 16 9 272625

350 2 10 700 3500 20 4 100 122500

300 1 4 300 1200 4 1 16 90000

2985 18 21 11170 8535 50 70 131 1820225

Las ecuaciones 13-2 13-3 y 13-4 se convierten en

Y ϭ na ϩ b1 X 1 ϩb2 X 2 2985 ϭ 6a ϩ 18b1 ϩ 21b2

X 1Y ϭ a X 1 ϩ b1 X 21 ϩb2 X 1 X 2 11170 ϭ 18a ϩ 70b1 ϩ 50b2

X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22 8535 ϭ 21a ϩ 50b1 ϩ 131b2

Al resolver estas ecuaciones simultaacuteneas se obtiene

a ϭ 964581 b1 ϭ 1364847 b2 ϭ Ϫ24035

De manera que la ecuacioacuten de regresioacuten es

Y ˆ ϭ 964581 ϩ 1364847 X 1 Ϫ 24035 X 2

b) Cuando el nuacutemero de habitaciones ϭ 2 y la distancia al centro ϭ 2

Y ˆ ϭ 964581 ϩ 1364847(2) Ϫ 24035(2) ϭ $365

133 La computadora y la regresioacutenmuacuteltiple

En el capiacutetulo 12 y hasta donde vamos de eacuteste hemos presentado problemas simplificados y muestrasde tamantildeo pequentildeo Despueacutes del ejemplo de la seccioacuten anterior probablemente usted haya llegadoa la conclusioacuten de que no estaacute interesado en la regresioacuten si tiene que hacer los caacutelculos a mano Dehecho conforme aumenta el tamantildeo de las muestras y crece el nuacutemero de variables independientespara la regresioacuten hacer los caacutelculos incluso con la ayuda de una calculadora de bolsillo se convier-te en algo muy inconveniente

Sin embargo como administradores debemos manejar problemas complejos que requieren mues-tras maacutes grandes y variables independientes adicionales Como ayuda para resolver estos problemasmaacutes detallados utilizaremos una computadora que nos permitiraacute realizar un gran nuacutemero de caacutelcu-los en poco tiempo

Suponga que tenemos no una ni dos variables independientes sino un nuacutemero k de ellas X 1

X 2 X k Como antes sea n el nuacutemero de datos que se tienen La ecuacioacuten de regresioacuten que inten-tamos estimar es

Inconvenienciadel caacutelculo deregresiones a mano

Ecuacioacuten de estimacioacuten de regresioacuten muacuteltiple

Y ˆ ϭ

b1 X 1ϩ

b2 X 2ϩ ϩ

bk X k [13-5]

Ahora veremos coacutemo podemos utilizar una computadora para estimar los coeficientes de regresioacutenPara demostrar coacutemo una computadora maneja el anaacutelisis de regresioacuten muacuteltiple tomemos el pro-

blema del Servicio Interno de Contribuciones (IRS) de la seccioacuten anterior Suponga que el departa-mento de auditoriacuteas agrega a su modelo la informacioacuten correspondiente a las recompensas para losinformantes La dependencia desea incluir esta tercera variable independiente X 3 debido a que sien-

Demostracioacuten de laregresioacuten muacuteltipleen la computadora

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1156

te que existe cierta relacioacuten entre estas recompensas y el descubrimiento de impuestos no pEn la tabla 13-3 se registroacute la informacioacuten de los uacuteltimos 10 meses

Para resolver este problema la divisioacuten de auditoriacutea usoacute el procedimiento de regresioacutende Minitab Por supuesto todaviacutea no sabemos coacutemo interpretar la solucioacuten que proporciocomo veremos la mayor parte de los nuacutemeros dados en la solucioacuten corresponden muy de c

los estudiados en el contexto de regresioacuten simple

Salida de Minitab

Una vez que se introducen los datos y se eligen las variables dependiente e independientescalcula los coeficientes de regresioacuten y varios estadiacutesticos asociados con la ecuacioacuten de regrveraacute la salida del programa para el problema del IRS La figura 13-2 da la primera parte de la

1 La ecuacioacuten de regresioacuten De los nuacutemeros dados en la columna Coef se puede leercioacuten de estimacioacuten

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ b3 X 3

ϭ Ϫ45796 ϩ 0597 X 1 ϩ 1177 X 2 ϩ 0405 X 3

Podemos interpretar esta ecuacioacuten en una forma similar a la de la ecuacioacuten de regresioacutevariables en la paacutegina 558 Si se mantienen constantes el nuacutemero de horas de audicampo X 1 y el nuacutemero de horas de computadora X 2 y se cambian las recompeninformantes X 3 entonces el valor de Y ˆ aumentaraacute $405000 por cada $1000 pagadosformantes De igual manera al mantener X 1 y X 3 constantes se ve que por cada 1adicionales de tiempo de computadora Y ˆ aumentaraacute $1177000 Por uacuteltimo si se dej

Buacutesqueda e interpre-tacioacuten de la ecuacioacutende regresioacuten

Salida del programaMinitab

Uso de Minitab pararesolver problemasde regresioacuten muacuteltiple

Factores relacionadoscon el descubrimientode impuestos nopagados

Tabla 13-3 Horas en Impueauditoriacuteas Horas Recompensa pagde campo en computadora a informantes descub(cientos) (cientos) (miles) (mill

Mes X 1 X 2 X 3

Enero 45 16 71 2

Febrero 42 14 70 2

Marzo 44 15 72 2

Abril 45 13 71 2

Mayo 43 13 75 2

Junio 46 14 74 2

Julio 44 16 76 3

Agosto 45 16 69 2

Septiembre 44 15 74 2

Octubre 43 15 73 2

FIGURA 13-2

Salida de Minitabpara la regresioacuten

del ServicioInterno deContribuciones

Anaacutel i s i s de r e gr e s i oacuten

La ec ua ci oacuten de r egr es i oacuten es

DESCUBRE ϭ mdash45 0 ϩ 0 597 AUDI T ϩ 1 18 COMPUTADORA ϩ 0 405 RECOMPENS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e Ϫ45 796 4 878 Ϫ9 39 0 000AUDI T 0 50697 0 08112 7 36 0 000COMPUTADORA 1 17684 0 08407 14 00 0 000RECOMPENSA 0 40511 0 04223 9 59 0 000

s ϭ 0 2861 R- s q ϭ 98 3

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1256

tantes X 2 y X 3 se estima que 100 horas adicionales dedicadas a auditoriacuteas de campo descubri-raacuten $597000 adicionales de impuestos no pagados Observe que se redondearon los valoresproporcionados por la regresioacuten dada por Minitab (figura 13-2)

Suponga que en noviembre el IRS intenta dejar las horas de trabajo en auditoriacuteas de cam-po y las horas en computadora en sus niveles de octubre (4300 y 1500) pero decide aumen-tar las recompensas pagadas a los informantes a $75000 iquestCuaacutento de impuestos no pagadosesperan descubrir en noviembre Sustituyendo estos valores en la ecuacioacuten de regresioacuten esti-mada obtenemos

Y ˆ ϭ Ϫ45796 ϩ 0597 X 1 ϩ 1177 X 2 ϩ 0405 X 3

Y ˆ ϭ Ϫ45796 ϩ 0597(43) ϩ 1177(15) ϩ 0405(75)

Y ˆ ϭ Ϫ45796 ϩ 25671 ϩ 17655 ϩ 30375

Y ˆ ϭ 27905 larr Descubrimientos estimados $27905000

De modo que el departamento de auditoriacuteas espera descubrir aproximadamente $28 millonesde evasioacuten de impuestos en noviembre

2 Una medida de dispersioacuten el error estaacutendar de la estimacioacuten de la regresioacuten muacuteltiple Ya quehemos determinado la ecuacioacuten que relaciona a nuestras tres variables necesitamos una me-dida de la dispersioacuten alrededor de este plano de regresioacuten muacuteltiple En la regresioacuten simple laestimacioacuten es maacutes precisa conforme el grado de dispersioacuten alrededor de la regresioacuten es menorLo mismo es cierto para los puntos de la muestra que se encuentran alrededor del plano de re-gresioacuten muacuteltiple Para medir esta variacioacuten debemos utilizar de nuevo la medida conocida co-

mo error estaacutendar de la estimacioacuten

Medicioacuten de ladispersioacuten alrededordel plano de regre-sioacuten muacuteltiple usodel error estaacutendar dela estimacioacuten

Error estaacutendar de la estimacioacuten

se ϭ Ί [13-6]Y ndash Y ˆ )2ᎏᎏ

n Ϫ k Ϫ 1

donde

bull Y ϭ valores muestrales de la variable dependientebull Y ˆ ϭ valores correspondientes estimados con la ecuacioacuten de regresioacutenbull n ϭ nuacutemero de puntos de la muestrabull k ϭ nuacutemero de variables independientes (ϭ 3 en nuestro ejemplo)

El denominador de esta ecuacioacuten indica que en la regresioacuten muacuteltiple con k variables in-

dependientes el error estaacutendar tiene n Ϫ k Ϫ 1 grados de libertad Esto se debe a que los

grados de libertad se reducen de n en k ϩ 1 constantes numeacutericas a b1 b2 hellip b k que se

estimaron a partir de la misma muestra

Para calcular se observamos los errores individuales (Y Ϫ Y ˆ ) en el plano de regresioacuten ajus-tado los elevamos al cuadrado calculamos su media (dividiendo entre n Ϫ k Ϫ 1 en lugar den) y tomamos la raiacutez cuadrada del resultado Debido a la forma en que se calcula se se cono-ce a veces como raiacutez del error cuadraacutetico medio [o raiacutez de mse (mean-square error)] De lasalida de Minitab que usa s en lugar de se para denotar el error estaacutendar vemos que la raiacutez demse en el problema del Servicio Interno de Contribuciones es 0286 es decir $286000

Como en el caso de la regresioacuten simple podemos utilizar el error estaacutendar de la estimacioacuteny la distribucioacuten t para formar un intervalo de confianza alrededor de nuestro valor estimadoY ˆ En el problema de la evasioacuten de impuestospara 4300 horas de trabajo en auditoriacuteas de cam-po 1500 horas en computadora y $75000 de pago a informantes Y ˆ es $27905000 como es-timacioacuten de impuestos no pagados descubiertos y se es $286000 Si deseamos construir unintervalo de confianza del 95 alrededor de esta estimacioacuten de $27905000 miramos enla tabla 2 del apeacutendice en la columna del 5 y localizamos ahiacute el rengloacuten correspondiente a

Intervalos deconfianza para Y ˆ

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1356

n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad El valor apropiado de t para nuestracioacuten del intervalo es de 2447 En consecuencia podemos calcular los liacutemites de nutervalo de confianza como sigue

Y ˆ ϩ t (se) ϭ 27905000 ϩ (2447)(286000)

Y ˆ ϩ t(se) ϭ 27905000 ϩ 699800

Y ˆ ϩ t(se) ϭ 28604800 larr Liacutemite superior

Y ˆ Ϫ t (se) ϭ 27905000 Ϫ (2447)(286000)

Y ˆ ϩ t(se) ϭ 27905000 ndash 699800

Y ˆ ϩ t(se) ϭ 27205200 larr Liacutemite inferior

Con un nivel de confianza del 95 el departamento de auditoriacuteas puede sentirse sque los descubrimientos reales estaraacuten en este intervalo que va de $27205200 a $28Si el IRS desea usar un nivel de confianza menor como 90 puede reducir el intevalores para la estimacioacuten de descubrimientos de impuestos no pagados Igual que cgresioacuten simple podemos utilizar la distribucioacuten normal estaacutendar (tabla 1 del apeacutendaproximar la distribucioacuten t siempre que los grados de libertad (n menos el nuacutemero cientes de regresioacuten estimados) sea un nuacutemero mayor que 30

Al antildeadir la tercera variable independiente (recompensas a informantes) iquestmejoroacuteregresioacuten Como se mide la dispersioacuten de los datos alrededor del plano de regresioacutenmenores de se deberiacutean indicar mejores regresiones Para la regresioacuten de dos variablecimos con anterioridad en este mismo capiacutetulo se resultoacute ser 1076 Como al agregarra variable se se redujo a 0286 vemos que siacute mejoroacute el ajuste de la regresioacuten en este Sin embargo en general no es cierto que al agregar variables siempre se reduzc

3 El coeficiente de determinacioacuten muacuteltiple Al estudiar el anaacutelisis de correlacioacuten simpmos la fuerza de la relacioacuten entre dos variables utilizando el coeficiente de determinla muestra r 2 Este coeficiente de determinacioacuten es la fraccioacuten de la variacioacuten total riable dependiente Y que se explica con la ecuacioacuten de estimacioacuten

Similarmente en la correlacioacuten muacuteltiple mediremos la fuerza de la relacioacuten entre trbles utilizando el coeficiente de determinacioacuten muacuteltiple R

2 o su raiacutez cuadrada R (el cte de correlacioacuten muacuteltiple) Este coeficiente de determinacioacuten muacuteltiple es tambieacuten la

que representa la porcioacuten de la variacioacuten total de Y que ldquoexplicardquo el plano de regr

Note que la salida del programa da el valor 983 para R2 Esto nos dice que las tr

bles independientes explican el 983 de la variacioacuten total de impuestos no pagadobiertos Para la regresioacuten de dos variables hecha antes R2 es soacutelo 0729 asiacute que las trabajo en auditoriacutea de campo y las horas en computadora explican el 729 de la vaagregar las recompensas a los informantes explica el 254 restante de la variacioacuten

Todaviacutea no hemos explicado los nuacutemeros en las columnas etiquetadas con Desvciente t y p de la figura 13-2 Estos nuacutemeros se utilizaraacuten para hacer inferencias acercano de regresioacuten de la poblacioacuten tema que se trataraacute en la seccioacuten 13-4

Uso del coeficientede determinacioacutenmuacuteltiple

Valor de variablesadicionales

Interpretacioacuten delintervalo deconfianza

Ya nadie calcula regresiones a mano hayotras cosas maacutes interesantes en queacute ocu-par nuestro tiempo Se explicoacute la teacutecnicacalculando las soluciones a mano para

que no tenga que pensar en su computadora como en unaldquocaja negrardquo que hace muchas cosas uacutetiles que no puedeexplicar Sugerencia el valor real de usar la computadorapara calcular regresiones muacuteltiples es que puede manejarmuchas variables independientes y obtener una mejor ecua-

cioacuten de estimacioacuten que puede medir si agregar otrble independiente realmente mejora los resultados yposible observar con rapidez el comportamiento de

indica la proporcioacuten de la variacioacuten total de la variapendiente que se explica con las variables indepenLa computadora hace todo el trabajo tedioso mdashsin semdash y le deja tiempo para el trabajo maacutes importcomprender los resultados y usarlos para tomar mdecisiones

SUGERENCIASY

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1456

La ec uac i oacuten de r egr es i oacuten esY = - 12 75 + 17 1 X1 + 0 54 1 X2 - 0 17 4 X3

Pr onos t i c ador Coe f De s vEs t Coc i e nt e - t pCons t a n t e - 1275 2699 - 0 47 0 719X1 17 059 6 908 2 47 0 245X2 0 5406 0 3144 1 72 0 335X3 - 0 1743 0 1005 - 1 73 0 333

s = 396 1 R- s q = 87 2

b) iquestQueacute porcentaje de la variacioacuten total del nuacutemero de solicitudes urgentes de devolucioacuten de impuestosexplica esta ecuacioacuten

c) Para este antildeo el iacutendice econoacutemico es 169 la poblacioacuten residente en un radio de una milla desde la

oficina es 10212 habitantes y el ingreso promedio en Ithaca es $26925 iquestCuaacutentas solicitudes urgen-tes de devolucioacuten de impuestos debe Pam esperar procesar entre el 1 de marzo y el 15 de abril

Conceptos baacutesicos 13-14 Dado el siguiente conjunto de datos utilice el paquete de software que tenga disponible para encontrar la

ecuacioacuten de regresioacuten de mejor ajuste y responda a lo siguientea) iquestCuaacutel es la ecuacioacuten de regresioacutenb) iquestCuaacutel es el error estaacutendar de la estimacioacutenc) iquestCuaacutel es el valor de R

2 para esta regresioacutend) iquestCuaacutel es el valor pronosticado para Y cuando X 1 ϭ 58 X 2 ϭ 42 y X 3 ϭ 51

Y X 1 X 2 X 3

647 35 53 85809 74 16 26246 25 63 45439 37 94 88777 55 14 36206 83 92 25669 67 25 27343 12 22 13

Ejercicios 133

Ejercicios de autoevaluacioacuten

EA 13-3 Pam Schneider posee y opera un despacho de contadores en Ithaca Nueva York Ella piensa que seriacutea uacutetilpredecir el nuacutemero de solicitudes urgentes de devolucioacuten de impuestos que le pediraacuten durante el ajetrea-do periodo del 1 de marzo al 15 de abril para poder planear mejor sus necesidades de personal duranteesta eacutepoca Tiene la hipoacutetesis de que varios factores pueden ser uacutetiles para su pronoacutestico Los datos de es-tos factores y el nuacutemero de solicitudes urgentes de devolucioacuten de impuestos de antildeos pasados son

Y X 2 Nuacutemero de

Poblacioacuten solicitudesresidente X 3 de devolucioacuten

X 1 en un radio Ingreso urgentesIacutendice de una milla promedio (1 de marzo

econoacutemico desde la oficina en Ithaca a 15 de abril)

99 10188 21465 2306106 8566 22228 1266100 10557 27665 1422129 10219 25200 1721179 9662 26300 2544

a) Use el siguiente resultado de Minitab para determinar la ecuacioacuten de regresioacuten maacutes adecuada para es-

tos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1556

13-15 Dado el siguiente conjunto de datos utilice el paquete de software que tenga a su disposicioacuten patrar la ecuacioacuten de regresioacuten de mejor ajuste y responda a lo siguientea) iquestCuaacutel es la ecuacioacuten de regresioacutenb) iquestCuaacutel es el error estaacutendar de la estimacioacutenc) iquestCuaacutel es el valor de R2 para esta regresioacutend) Deacute un intervalo de confianza para la estimacioacuten del 95 para el valor Y cuando los valores X

y X 4 son 524 416 358 y 3 respectivamente

X 1 X 2 X 3 X 4 Y

214 629 219 Ϫ2 228

517 407 429 5 937418 818 698 2 649

118 410 909 Ϫ4 192

716 226 129 8 558

919 615 309 1 231

Aplicaciones

1316 Las estaciones de policiacutea en Estados Unidos estaacuten interesadas en predecir el nuacutemero de arrestodos que deberaacuten procesar cada mes para programar mejor a los empleados de oficina En los daricos el nuacutemero promedio de arrestos (Y ) cada mes tiene influencia del nuacutemero de oficiales en

policiaca ( X 1) la poblacioacuten de la ciudad en miles ( X 2) y el porcentaje de personas desempleadasdad en miles ( X 3) Los datos de estos factores en 15 ciudades se presentan en la tablaa) Utilice el paquete de software que tenga disponible para determinar la ecuacioacuten de regresioacuten

jor se ajuste a estos datosb) iquestQueacute porcentaje de la variacioacuten total en el nuacutemero de arrestos (Y ) explica esta ecuacioacutenc) El departamento de policiacutea de ChapelBoro desea pronosticar el nuacutemero de arrestos mensua

pelBoro tiene una poblacioacuten de 75000 habitantes 82 elementos en su fuerza policiaca y utaje de desempleo del 105 iquestCuaacutentos arrestos pronostica para cada mes

Nuacutemero promedio Nuacutemero de oficiales Tamantildeo de la ciudad (X 2) Porcende arrestos mensuales (Y ) en la fuerza (X 1) en miles de habitantes desemp

3906 68 816 4

5043 94 751 3

6284 125 973 5

7456 175 1235 8

5852 113 1184 11

4503 82 654 9

3278 46 616 12

2605 32 543 18

4775 89 974 4

3898 67 824 6

3124 47 564 8

3675 59 713 7

3744 61 674 9

4946 87 963 11

4875 92 864 4

13-17 Estamos intentando predecir la demanda anual (DEMAND) de cierto producto utilizando las svariables independientes

PRECIO ϭ precio del producto (en doacutelares)

INGRESO ϭ ingreso del consumidor (en doacutelares)

SUB ϭ precio de un bien sustituto (en doacutelares)

( Nota Un bien sustituto es aquel que puede suplir a otro bien Por ejemplo la margarina es untituto de la mantequilla)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1656

Se recolectaron datos correspondientes al periodo 1982-1996

Antildeo Demanda Precio ($) Ingreso ($) Sub ($)

1982 40 9 400 101983 45 8 500 141984 50 9 600 121985 55 8 700 131986 60 7 800 111987 70 6 900 151988 65 6 1000 161989 65 8 1100 17

1990 75 5 1200 221991 75 5 1300 191992 80 5 1400 201993 100 3 1500 231994 90 4 1600 181995 95 3 1700 241996 85 4 1800 21

a) Utilice el paquete de software que tenga disponible para encontrar la ecuacioacuten de regresioacuten ajuste para estos datos

b) iquestSon los signos (ϩ o Ϫ) de los coeficientes de regresioacuten de las variables independientes los qperan Deacute una explicacioacuten breve ( Nota Eacutesta no es una pregunta estadiacutestica soacutelo necesita pesignifican los coeficientes de regresioacuten)

c) Establezca e interprete el coeficiente de determinacioacuten muacuteltiple del problemad) Establezca e interprete el error estaacutendar de la estimacioacuten para el problemae) Seguacuten la ecuacioacuten de regresioacuten obtenida iquestqueacute valor de DEMAND predeciriacutea si el precio de

ductos fue $6 el ingreso del consumidor $1200 y el precio del bien sustituto $17 13-18 Bill Buxton profesor de estadiacutestica de una prominente escuela de administracioacuten tiene un prof

tereacutes en los factores que afectan el desempentildeo de los estudiantes en los exaacutemenes El examen psemestre anterior tuvo una distribucioacuten de calificaciones amplia pero Bill tiene la certeza de qfactores explican esa distribucioacuten permite a sus estudiantes que estudien en tantos libros comoca el coeficiente de inteligencia de los estudiantes variacutea tienen distintas edades y difieren losque dedican a estudiar Con el propoacutesito de desarrollar una foacutermula de prediccioacuten para las califde los exaacutemenes Bill pidioacute a cada estudiante que respondiera al final del examen preguntas refe

tiempo de estudio y nuacutemero de libros utilizados Los registros que teniacutea Bill ya incluiacutean el coefiinteligencia y la edad de modo que reunioacute los datos del grupo y corrioacute la regresioacuten muacuteltiple deLa salida de la corrida de Bill fue la siguiente

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t Con s t a nt e minus49 948 41 55 minus1 20 0HORAS 1 06931 0 98163 1 09 0CI 1 36460 0 37627 3 63 0LI BROS 2 03982 1 50799 1 35 0EDAD minus1 79890 0 67332 minus2 67 0

s = 11 657 R- s q = 76 7

a) iquestCuaacutel es la ecuacioacuten de regresioacuten de mejor ajuste para estos datos

b) iquestQueacute porcentaje de la variacioacuten en las calificaciones se explica con esta ecuacioacutenc) iquestQueacute calificacioacuten esperariacutea usted para un estudiante de 21 antildeos de edad con un coeficiente gencia (CI) de 113 que estudioacute durante cinco horas y utilizoacute tres libros diferentes

13-19 La compantildeiacutea de tiendas de abarrotes Twenty-Two estaacute planeando expandir su cadena Como ayudleccionar los lugares donde abriraacute las nuevas tiendas recolectoacute datos de las ventas semanales de casus 23 tiendas Para explicar la variabilidad de las ventas semanales tambieacuten reunioacute informacioacutencribe cuatro variables que se cree estaacuten relacionadas con las ventas Las variables se definen como

VENTAS ϭ ventas semanales promedio en cada tienda en miles de doacutelares

AUTOS ϭ volumen promedio de traacutensito de automoacuteviles por semana en miles de autos

ENTRADA ϭ facilidad de entradasalida medida en una escala de 1 a 100

INGANUAL ϭ ingreso anual promedio por familia en el aacuterea en miles de doacutelares

DISTANCIA ϭ distancia en millas desde la tienda al supermercado maacutes cercano

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1756

Los datos se analizaron con Minitab y la salida es la siguiente

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t Cons t a nt e 175 37 92 62 1 89 0 0AUTOS - 0 028 0 315 minus0 09 0 9ENTRADA 3 775 1 272 2 97 0 0I NGANUAL 1 990 4 510 0 44 0 6DI STANCI A 212 41 28 090 7 56 0 0

s = 85 587 R- s q = 95 8

a) iquestCuaacutel es la ecuacioacuten de regresioacuten de mejor ajuste dada por Minitab

b) iquestCuaacutel es el error estaacutendar de la estimacioacuten para esta ecuacioacutenc) iquestQueacute fraccioacuten de la variacioacuten en las ventas se explica con esta regresioacutend) iquestQueacute ventas predeciriacutea para una tienda localizada en un vecindario que tuvo un ingreso anu

milia de $20000 estaba a 2 millas del supermercado maacutes cercano se encontraba en una calvolumen promedio semanal de traacutensito de 100000 autos y con una facilidad de entrada de

13-20 Rick Blackburn estaacute pensando en vender su casa Con el fin de decidir el precio que pediraacute poreunido datos de 12 ventas recientes Registroacute el precio de venta (en miles de doacutelares) el nuacutemercuadrados de construccioacuten (en cientos de pies cuadrados) el nuacutemero de pisos el nuacutemero de bantiguumledad de la casa (en antildeos)

Precio de venta Pies cuad Pisos Bantildeos Antiguumledad

4965 89 1 10 2

6795 95 1 10 68115 126 2 15 11

8160 129 2 15 8

9150 190 2 10 22

9525 176 1 10 17

10035 200 2 15 12

10425 206 2 15 11

11265 205 1 20 9

14970 251 2 20 8

16065 227 2 20 18

23250 408 3 40 12

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de

de mejor ajuste para los datosb) iquestCuaacutel es el valor de R2 para esta ecuacioacutenc) Si la casa de Rick tiene 1800 pies cuadrados (ϭ 180 cientos de pies cuadrados) un piso

y seis antildeos de antiguumledad iquestqueacute precio de venta puede esperar Rick 13-21 La Allegheny Steel Corporation ha estado buscando los factores que influyen en la cantidad de

millones de toneladas) que puede vender cada antildeo La administracioacuten sospecha que los siguientfactores principales la tasa anual de inflacioacuten del paiacutes el precio promedio por tonelada del acetado que acota los precios (en doacutelares) de Allegheny y el nuacutemero de automoacuteviles (en millonesfabricantes de autos de Estados Unidos planean producir ese antildeo Se recolectaron los datos de losiete antildeos

Y X 2 X 3

Millones X 1 Cota de Nuacutemero

de tons Tasa de importa- deAntildeo vendidas inflacioacuten ciones automoacuteviles

1993 42 31 310 62

1992 31 39 500 51

1991 40 75 220 57

1990 47 107 450 71

1989 43 155 435 65

1988 37 130 260 61

1987 35 110 305 59

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1856

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de regresioacutende mejor ajuste para los datos

b) iquestQueacute porcentaje de la variacioacuten total de la cantidad de acero vendido (en millones de toneladas) porAllegheny cada antildeo explica esta ecuacioacuten

c) iquestCuaacutentas toneladas de acero deberaacute esperar Allegheny vender en un antildeo en el que la tasa de inflacioacutenes 71 los fabricantes de automoacuteviles norteamericanos planean producir 60 millones de autos y la co-ta promedio del acero importado por tonelada es $350

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-3 De la salida del paquete de software se obtienen los siguientes resultadosa) Y ˆ ϭ Ϫ1275 ϩ 17059 X 1 ϩ 05406 X 2 Ϫ 01743 X 3b) R

2ϭ 872 el modelo explica el 872 de la variacioacuten total en Y

c) Y ˆ ϭ Ϫ1275 ϩ 17059(169) ϩ 05406(10212) Ϫ 01743(26925) ϭ 2436 reembolsos de impuestos

134 Inferencias sobre paraacutemetrosde poblacioacuten

En el capiacutetulo 12 se vio que la recta de regresioacuten de la muestra Y ˆ ϭ a ϩ bX (ecuacioacuten 12-3) esti-maba la recta de regresioacuten de la poblacioacuten Y ϭ A ϩ BX (ecuacioacuten 12-13) La razoacuten por la cual soacute-lo podiacuteamos estimar la recta de regresioacuten de poblacioacuten y no determinarla con exactitud era que los

puntos no caen exactamente en la recta de regresioacuten de la poblacioacuten Debido a las variaciones alea-torias los puntos satisfaciacutean Y ϭ A ϩ BX ϩ e (ecuacioacuten 12-13a) maacutes que a Y ϭ A ϩ BX

En la regresioacuten muacuteltiple se tiene justo la misma situacioacuten Nuestro plano de regresioacuten estimado

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k [13-5]

es una estimacioacuten de un plano de regresioacuten de poblacioacuten verdadero pero desconocido de la forma

Plano de regresioacutende la poblacioacuten

De nuevo los puntos individuales normalmente no caen con exactitud en el plano de regresioacuten depoblacioacuten Consideremos el problema del Servicio Interno de Contribuciones para ver por queacute Notodos los pagos a informantes tendraacuten la misma efectividad Algunas horas en computadora podriacuteanutilizarse para recolectar y organizar datos otras para analizar esos datos en busca de errores y frau-des El eacutexito de la computadora en descubrir impuestos no pagados puede depender de cuaacutento tiempose dedique a cada una de estas actividades Por eacutestas y otras razones algunos de los puntos se en-contraraacuten arriba del plano de regresioacuten y algunos estaraacuten abajo de eacuteste En lugar de satisfacer laecuacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

los puntos individuales satisfaraacuten la ecuacioacuten

Las variaciones alea-torias desplazan lospuntos del plano deregresioacuten

Ecuacioacuten de regresioacuten de la poblacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

Plano de regresioacuten de la poblacioacuten maacutes la variacioacuten aleatoria

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e [13-7a]

La cantidad e que aparece en la ecuacioacuten 13-7a es una variacioacuten aleatoria que en promedio es iguala cero La desviacioacuten estaacutendar de las variaciones individuales e y el error estaacutendar de la estima-cioacuten se que estudiamos en la seccioacuten anterior es una estimacioacuten de e

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1956

Como nuestro plano de regresioacuten de la muestra Y ˆ ϭ a ϩ b1X1 ϩ b2 X 2 ϩ ϩ bk X k (ecuaci13-7) estima el plano de regresioacuten de poblacioacuten desconocido Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk

(ecuacioacuten 13-7) deberemos ser capaces de usarlo para hacer inferencias sobre el plano de regreside la poblacioacuten En esta seccioacuten haremos inferencias acerca de las pendientes ( B1 B2 Bk ) deecuacioacuten de regresioacuten ldquoverdaderardquo (la que se aplica a la poblacioacuten completa) basadas en las pendietes (b1 b2 bk ) de la ecuacioacuten de regresioacuten estimada a partir de la muestra de datos

Inferencias acerca de una pendiente individual B i El plano de regresioacuten se deriva de una muestra y no de la poblacioacuten completa Como resultado

podemos esperar que la ecuacioacuten de regresioacuten verdadera Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k que se aplica a la poblacioacuten completa) sea exactamente igual que la ecuacioacuten estimada a partir observaciones de la muestra Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k Sin embargo podemos utilizarvalor de bi una de las pendientes que calculamos a partir de la muestra para probar hipoacutetesis acca del valor de Bi una de las pendientes del plano de regresioacuten para la poblacioacuten completa

El procedimiento para probar una hipoacutetesis respecto a Bi es parecido al procedimiento analizaen los capiacutetulos 8 y 9 sobre pruebas de hipoacutetesis Para entender este proceso regresemos al probma que relaciona los impuestos no pagados descubiertos con las horas de trabajo en auditoriacuteas campo horas en computadora y recompensas a informantes En la paacutegina 729 sentildealamos que b10597 El primer paso consiste en encontrar un valor para B1 y compararlo con b1 ϭ 0597

Suponga que durante un periodo largo la pendiente de la relacioacuten entre Y y X 1 fue 0400 Paprobar si todaviacutea es vaacutelida podriacuteamos definir las hipoacutetesis como

H0 B1 ϭ 0400 larr Hipoacutetesis nula

H1 B1 0400 larr Hipoacutetesis alternativa

De hecho realizamos la prueba para saber si los datos actuales indican que B1 ha cambiado su vahistoacuterico de 0400

Para encontrar el estadiacutestico de prueba para B1 es necesario hallar primero el error estaacutendar d

coeficiente de regresioacuten El coeficiente de regresioacuten con el que estamos trabajando es b1 de moque el error estaacutendar de este coeficiente se representa con sb1

Resulta demasiado difiacutecil calcular sb1 a mano pero por fortuna Minitab calcula los errores estaacutedar de todos los coeficientes de regresioacuten Por comodidad repetimos la figura 13-2 Los errores taacutendar de los coeficientes se dan en la columna DesvEst de la salida de Minitab

En el cuadro de salida vemos que sb1

es 00811 (Similarmente si deseamos probar una hipoacutesis acerca de B2 vemos que el error estaacutendar apropiado que debemos utilizar es sb2 ϭ 00841) Uvez que encontramos sb1 en la salida de Minitab podemos usar la ecuacioacuten 13-8 para estandarizarpendiente de nuestra ecuacioacuten de regresioacuten ajustada

Estandarizacioacutendel coeficiente deregresioacuten

Error estaacutendar delcoeficientede regresioacuten

Prueba de unahipoacutetesis acerca de B i

Diferencia entre la

ecuacioacuten de regre-sioacuten verdadera y unaestimada a partir delas observacionesde la muestra

Coeficiente de regresioacuten estandarizado

t ϭ [13-8bi ndash Bi0ᎏ

sbi

donde

bull biϭ pendiente de la regresioacuten ajustada

bull Bi0 ϭ pendiente real hipoteacutetica para la poblacioacutenbull sbi ϭ error estaacutendar del coeficiente de regresioacuten

iquestPor queacute utilizamos t para denotar el estadiacutestico estandarizado Recuerde que en la regresioacuten siple utilizamos a y b en la ecuacioacuten 12-7 para calcular se y que se estimaba e la desviacioacuten estaacutedar de las variaciones de los datos (ecuacioacuten 12-13a) Entonces utilizamos se en la ecuacioacuten 12-para encontrar sb el error estaacutendar del coeficiente de regresioacuten que corresponde a la pendiente E

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2056

pezamos con n puntos y los usamos para estimar los dos coeficientes a y b Luego basamtras pruebas en la distribucioacuten t con n Ϫ 2 grados de libertad

De manera similar en la regresioacuten muacuteltiple tambieacuten empezamos con n puntos pero lospara estimar k ϩ 1 coeficientes la ordenada a y k pendientes b1 b2 bk Despueacutes estcientes se usan en la ecuacioacuten 13-6 para calcular se que de nuevo es una estimacioacuten de eviacioacuten estaacutendar de las variaciones de los datos (ecuacioacuten 13-7a) Luego se utiliza se (en ucioacuten que estaacute maacutes allaacute del alcance de este libro) para encontrar s

bi Debido a lo anterior

nuestras pruebas de hipoacutetesis en la distribucioacuten t con n Ϫ k Ϫ 1 (ϭ n Ϫ ( k ϩ l)) grados de En nuestro ejemplo el valor estandarizado del coeficiente de regresioacuten es

t ϭ

ϭ

ϭ 2432 larr Coeficiente de regresioacuten estandarizado

Suponga que estamos interesados en probar nuestras hipoacutetesis al nivel de significancia

Como tenemos 10 observaciones en la muestra y tres variables independientes sabemos n Ϫ k Ϫ 1 o 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad Buscamos en la tabla 2 del apeacutendice en lana de 10 y el rengloacuten de 6 grados de libertad Ahiacute vemos que el valor apropiado de t es 19mo nos preocupa si b1 (la pendiente del plano de regresioacuten de la muestra) es significativamferente de B1 (la pendiente hipoteacutetica del plano de regresioacuten de la poblacioacuten) eacutesta es una pdos colas y los valores criacuteticos son Ϯ1943 El coeficiente de regresioacuten estandarizado es 2se encuentra fuera de la regioacuten de aceptacioacuten de nuestra prueba de hipoacutetesis Por consiguichazamos la hipoacutetesis nula de que B1 todaviacutea es igual a 0400 En otras palabras existe unacia suficientemente grande entre b1 y 0400 para concluir que B1 ha cambiado respecto a histoacuterico Por esto sentimos que cada 100 horas adicionales de trabajo en auditoriacuteas de camaumentan la cantidad de descubrimientos de impuestos no pagados en $400000 como lo hel pasado

Ademaacutes de la prueba de hipoacutetesis podemos construir un intervalo de confianza para cude los valores de Bi Del mismo modo que bi es una estimacioacuten puntual de Bi estos intervalofianza son estimaciones de intervalo de Bi Para ilustrar el proceso de construccioacuten de interconfianza encontremos un intervalo de confianza del 95 para B3 en el ejemplo del IRS Lrelevantes son

b3 ϭ 0405 de la figura 13-2sb3 ϭ 00422

t ϭ 2447 larr Nivel de significancia del 5 y 6 grados de libertad

Intervalo deconfianza para B i

Realizacioacuten de la

prueba de hipoacutetesis

0597 ndash 0400ᎏᎏ

0081

b1 ndash B10ᎏ

sb1

Anaacute l i s i s de r e gr e s i oacutenLa ec uaci oacuten de r egr es i oacuten esDESCUBRE = - 45 0 + 0 597 AUDI TORIacute A + 1 18 COMPUTADORA + 0 405 RECOMPENSA

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 45 796 4 878 - 9 39 0 000AUDI TORIacute A 0 50697 0 08112 7 36 0 000COMPUTADORA 1 17684 0 08407 14 00 0 000RECOMPENSAS 0 40511 0 04223 9 59 0 000

s = 0 2861 R- s q = 98 3

FIGURA 13-2

Salida de Minitab(figura repetida)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2156

Con esta informacioacuten podemos calcular el intervalo de confianza de la siguiente manera

b3 ϩ t (sb3) ϭ 0405 ϩ 2447(00422)

ϭ 0508 larr Liacutemite superior

b3 Ϫ t (sb3) ϭ 0405 Ϫ 2447(00422)

ϭ 0302 larr Liacutemite inferior

Vemos que podemos tener una seguridad del 95 de que cada $1000 adicionales pagados a los formantes aumenta el descubrimiento de impuestos no pagados en una cantidad entre $302000$508000

A menudo estaremos interesados en preguntas del tipo iquesten realidad Y depende de X i Por ejeplo podriacuteamos preguntar si descubrir impuestos no pagados en realidad depende de las horas encomputadora Con frecuencia esta pregunta se plantea como iquestes X i una variable explicativa sigficativa de Y Si piensa un poco maacutes se convenceraacute de que si Bi 0 Y depende de las X i (esto esvariacutea cuando X i variacutea) y no depende de X i si Bi ϭ 0

Vemos que nuestra pregunta conduce a establecer hipoacutetesis de la forma

H0 Bi ϭ 0 larr Hipoacutetesis nula X i no es una variable explicativa significativa

H1 Bi 0 larr Hipoacutetesis alternativa X i es una variable explicativa significativa

Podemos probar estas hipoacutetesis utilizando la ecuacioacuten 13-8 del mismo modo que cuando probamnuestras hipoacutetesis acerca de si B1 todaviacutea era igual a 0400 Sin embargo existe una forma maacutes faacutede hacerlo usando la columna de la figura 13-2 de ldquocociente- t rdquo Observemos de nuevo la ecuaci13-8

t ϭ [13-

Como nuestro valor hipoteacutetico de Bi es cero el valor estandarizado del coeficiente de regresioacutedenotado por t o se convierte en

t o ϭ

El valor de t o se conoce como valor t ldquocalculadordquo Eacuteste es el nuacutemero que aparece en la columna equetada como ldquocociente-t rdquo en la figura 13-2 Denotemos por t c el valor t ldquocriacuteticordquo que buscamos

la tabla 2 del apeacutendice Entonces como la prueba para determinar si X i es una variable explicatisignificativa es una prueba de dos colas soacutelo necesitamos verificar si Ϫt c Յ t o Յ t c

Uso de valores t

calculados en lasalida de Minitab

biᎏ

sbi

bi ndash Bi0ᎏ

sbi

iquestEs significativa unavariable explicativa

Prueba para determinar si una variable es o no significativa

Ϫt c Յ t o Յ t c [13-9

donde

bull t c ϭ valor t adecuado (con n Ϫ k Ϫ 1 grados de libertad) para el nivel de significancia deprueba

bull t o ϭ bi sbi ϭ valor t observado (o calculado) obtenido con el paquete de software

Si t o

cae entre Ϫt c

y t c aceptamos H0 y llegamos a la conclusioacuten de que X

ino es una variable exp

cativa significativa En cualquier otro caso rechazamos H0 y concluimos que X i es una variable eplicativa significativa

Probemos al nivel de significancia de 001 si las horas en computadora constituyen una variabexplicativa significativa para los impuestos no pagados descubiertos De la tabla 2 del apeacutendice cn Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad y ϭ 001 vemos que t c ϭ 3707 De la figura 13tenemos que t o = 1400 Como t o Ͼ t c concluimos que el tiempo en computadora es una variab

Prueba de lasignificancia de lavariable horas decomputadora en elproblema del IRS

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2256

explicativa significativa De hecho al observar los valores t calculados para las otras dos vindependientes (tiempo de auditoriacuteas de campo t o ϭ 736 y recompensa a informantes t ovemos que tambieacuten son variables explicativas significativas

Podemos tambieacuten utilizar la columna de ldquoprdquo para probar si X i es una variable explicativacativa De hecho utilizando esa informacioacuten ni siquiera necesitamos usar la tabla 2 del aLos elementos de esta columna son los valores prob para las hipoacutetesis

H0 Biϭ 0

H1 Bi 0

Recuerde del anaacutelisis hecho en el capiacutetulo 9 que estos valores prob constituyen la probabque cada bi esteacute tan lejos de cero como (o maacutes) el valor observado obtenido de la regresioacutenverdadera Como se ilustra en la figura 13-3 solamente necesitamos comparar estos valocon el nivel de significancia de la prueba para determinar si X i es o no una variable expsignificativa para Y

Probar la significancia de una variable explicativa es siempre una prueba de dos colas Lble independiente X i es una variable explicativa significativa si bi es significativamente dife

cero es decir si t o es un nuacutemero grande positivo o negativoPara el ejemplo del IRS repetimos las pruebas con ϭ 001 Para cada una de las tres v

independientes p es menor que 001 de forma que podemos concluir que cada una de ellanificativa

Inferencias acerca de la regresioacuten como un todo

(usando una prueba F )

Suponga que cubre con papel un tablero para dardos y lanza varios dardos sobre eacutel Despueacuteberlo hecho tendraacute algo muy parecido a un diagrama de dispersioacuten Suponga entonces quuna recta de regresioacuten a este conjunto de ldquopuntos observadosrdquo y calcula r

2 Debido a que lofueron lanzados aleatoriamente usted espera obtener un valor bajo de r

2 puesto que en esten realidad no explica a Y Sin embargo si hace esto muchas veces ocasionalmente observalor alto de r

2 por pura casualidadDada cualquier regresioacuten simple (o muacuteltiple) es natural preguntarse si el valor de r2 (

realmente indica que las variables independientes explican a Y o si esto sucede por cas

A menudo esta interrogante se plantea de la siguiente manera iquestla regresioacuten como un todo ficativa En la uacuteltima seccioacuten vimos coacutemo decidir si una X i individual es una variable exp

Significancia de laregresioacuten comoun todo

FIGURA 13-3

Uso de ldquoprdquo paradeterminar si X i esuna variable expli-cativa significativa

Regioacuten de aceptacioacuten Regioacuten de aceptacioacuten

2 del aacuterea

2 del aacuterea

2 del aacuterea

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

ndasht c

ndasht o

t o

t c

0

(a) p es mayor que X

i no es una variable

explicativa significativa

(b) p es menor que X

i es una variable

explicativa significativa

ndasht o

ndasht c

t c

0

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2356

significativa ahora veremos coacutemo decidir si todas las X i tomadas en conjunto explican significavamente la variabilidad observada de Y Nuestras hipoacutetesis son

H0 B1 ϭ B2 ϭ ϭ Bk ϭ 0 larr Hipoacutetesis nula Y no depende de las X i

H1 por lo menos una Bi 0 larr Hipoacutetesis alternativa Y depende de al menos una de las X i

Cuando analizamos r 2 en el capiacutetulo 12 consideramos la variacioacuten total en Y sum(Y Ϫ Y ෆ )2 la p

te de dicha variacioacuten que explica la regresioacuten sum(Y ˆ Ϫ Y ෆ )2 y la parte no explicada de la variacioacutensum(Y Ϫ Y ˆ )2 La figura 13-4 es un duplicado de la figura 12-15 Sirve como repaso de la relacioacuten etre la desviacioacuten total la desviacioacuten explicada y la desviacioacuten no explicada para un solo dato en uregresioacuten simple Aunque no podamos dibujar una figura similar para una regresioacuten muacuteltiple coceptualmente estamos haciendo lo mismo

Al analizar la variacioacuten en Y fijamos nuestra atencioacuten en tres teacuterminos diferentes cada uno de cuales es una suma de cuadrados Los denotamos con

Suma de cuadradosy sus grados delibertad

Anaacutelisis de lavariacioacuten de losvalores Y

FIGURA 13-4

Desviacioacuten totaldesviacioacutenexplicada ydesviacioacuten noexplicada paraun valor observadode Y

Y

X

Un valor observado de lavariable dependiente (Y )

R e c t a d

e r e g r e s

i oacute n

Desviacioacuten no explicada de esta Y respectoa su media Y

(Y ndash Y )^

Desviacioacuten explicada deesta Y respecto a su media Y

(Y ndash Y )^Y

Valor estimado de esta Y

a partir de la recta de regresioacuten (Y )^

Desviacioacuten total de esta Y

respecto a su media Y

(Y ndash Y )

Tres sumas de cuadrados

SCT ϭ suma de cuadrados total (es decir la parte explicada) ϭ sum(Y Ϫ Y ෆ )2

SCR ϭ suma de cuadrados de la regresioacuten (es decir la parte explicada) ϭ sum(Y ˆ Ϫ Y ෆ )2 [13-10

SCE ϭ suma de cuadrados del error (es decir la parte no explicada) ϭ sum(Y Ϫ Y ˆ )2

Estaacuten relacionadas por la ecuacioacuten

que dice que la variacioacuten total en Y puede dividirse en dos partes la parte explicada y la no explicaCada una de estas sumas de cuadrados tiene un nuacutemero asociado de grados de libertad SCT t

ne n Ϫ 1 grados de libertad (n observaciones menos un grado de libertad debido a que la media la muestra estaacute fija) SCR tiene k grados de libertad porque existen k variables independientes qse utilizaron para explicar Y Finalmente SCE tiene n Ϫ k Ϫ 1 grados de libertad porque utilizamnuestras n observaciones para estimar k ϩ 1 constantes a b1 b2 bk Si la hipoacutetesis nula es ci

ta el cociente

Descomposicioacuten de la variacioacuten total de Y

SCT ϭ SCR ϩ SCE [13-1

Cociente F

F ϭ [13-12SCR k ᎏᎏ

SCE(n ndash k ndash 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2456

tiene una distribucioacuten F con k grados de libertad en el numerador y n Ϫ k Ϫ 1 grados de libel denominador Si la hipoacutetesis nula es falsa entonces el cociente tiende a ser maacutes grande qula hipoacutetesis nula es verdadera De modo que si el cociente F es demasiado grande (seguacuten lo na el nivel de significancia de la prueba y el valor apropiado de la tabla 6 del apeacutendice) rechH0 y concluimos que la regresioacuten como un todo es significativa

La figura 13-5 presenta la salida de Minitab para el problema del IRS Esta parte del rincluye los cocientes F calculados para la regresioacuten en ocasiones llamado anaacutelisis de v

(ANOVA) para la regresioacuten Probablemente se pregunte si esto tiene algo que ver con el anaacutelisrianza que estudiamos en el capiacutetulo 11 La respuesta es siacute Aunque no lo hicimos es posibletrar que el anaacutelisis de varianza visto en el capiacutetulo 11 tambieacuten contempla la variacioacuten total las observaciones alrededor de la gran media y la divide en dos partes una explicada por lascias entre los distintos grupos (que corresponde a lo que llamamos varianza entre columnas)

no explicada por dichas diferencias (que corresponde a la varianza dentro de columnas) Estcisamente anaacutelogo a lo que acabamos de hacer en la ecuacioacuten 13-11Para el problema del IRS vemos que SCR ϭ 29109 (con k ϭ 3 grados de libertad) SCE

(con n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad) y que

F ϭ ϭ ϭ 11833

Los elementos en la columna ldquoMCrdquo son justo las sumas de cuadrados divididas entre sus glibertad Para 3 grados de libertad en el numerador y 6 en el denominador la tabla 6 del apeacutence que 978 es el liacutemite superior de la regioacuten de aceptacioacuten para un nivel de significancia El valor calculado de F 11833 estaacute muy por arriba de 978 de manera que se ve que la r

como un todo es altamente significativa Se puede llegar a la misma conclusioacuten si se observresultado del programa dice que ldquo prdquo es 0000 Debido a que este valor prob es menor que elsignificancia ϭ 001 se concluye que la regresioacuten completa es significativa De esta mapuede usar la p de ANOVA como prueba sin tener que utilizar la tabla 6 del apeacutendice para bvalor criacutetico de F Esto es anaacutelogo a la manera en que se usaron los valores de p en la figura ra probar la significancia de las variables explicativas individuales

Multicolinealidad en la regresioacuten muacuteltiple

En el anaacutelisis de regresioacuten muacuteltiple los coeficientes de regresioacuten a menudo se vuelven

confiables conforme aumenta el grado de correlacioacuten entre las variables independie

existe un alto nivel de correlacioacuten entre algunas de las variables independientes nos enfrenun problema que los estadiacutesticos llaman multicolinealidad

La multicolinealidad puede presentarse si deseamos estimar la recuperacioacuten de las ventaempresa y utilizamos tanto el nuacutemero de vendedores empleados como sus salarios totales Cvalores asociados con estas dos variables independientes tienen una correlacioacuten alta neceusar soacutelo un conjunto de ellos para realizar nuestra estimacioacuten De hecho al agregar una segriable que estaacute correlacionada con la primera se distorsionan los valores de los coeficientgresioacuten Sin embargo a menudo podemos predecir bien Y incluso cuando haya multicoline

Consideremos un ejemplo donde existe multicolinealidad para ver coacutemo afecta a la regresrante los 12 meses pasados el gerente del restaurante Pizza Shack ha estado poniendo unaanuncios en el perioacutedico local Los anuncios se programan y pagan el mes anterior a que ap

Un ejemplo demulticolinealidad

Definicioacuten y efecto dela multicolinealidad

9703ᎏ

0082

29109 3ᎏ

0491 6Prueba de lasignificancia de laregresioacuten en elproblema del Serviciode Contribuciones

Anaacutelisis devarianza parala regresioacuten

Prueba F de laregresioacuten como

un todo

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 29 1088 9 7029 118 52 0Er r or 6 0 4912 0 0819Tot al 9 29 6000

FIGURA 13-5Salida de Minitabanaacutelisis devarianza

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2556

Cada anuncio contiene un cupoacuten que permite llevarse dos pizzas pagando solamente la de mcio El gerente recolectoacute los datos de la tabla 13-4 y le gustariacutea utilizarlos para predecir las vpizzas

En las figuras 13-6 y 13-7 se dieron los resultados de Minitab para las regresiones respelas ventas totales sobre el nuacutemero de anuncios y sobre el costo

Para la regresioacuten sobre el nuacutemero de anuncios tenemos que el valor t observado es 395grados de libertad y un nivel de significancia de ϭ 001 se encontroacute que el valor t criacuteticdo de la tabla 2 del apeacutendice) es 3169 Como t o Ͼ t c (o de manera equivalente como p es m001) concluimos que el nuacutemero de anuncios es una variable explicativa altamente signifilas ventas totales Note tambieacuten que r 2 ϭ 610 de modo que el nuacutemero de anuncios explximadamente el 61 de la variacioacuten en las ventas de pizzas

Para la regresioacuten sobre el costo de los anuncios el valor t observado es 454 de modo qude los anuncios es una variable explicativa de las ventas totales todaviacutea maacutes significativa que ro de anuncios (para los que el valor t observado fue soacutelo 395) En esta regresioacuten r 2 ϭ 673

el costo de los anuncios explica aproximadamente el 67 de la variacioacuten de las ventas de pizComo ambas variables explicativas son altamente significativas por siacute mismas intentam

zar ambas en una regresioacuten muacuteltiple El resultado se presenta en la figura 13-8La regresioacuten muacuteltiple es altamente significativa como un todo ya que la p de ANOVA e

Uso de ambas varia-bles explicativas enuna regresioacuten muacuteltiple

Dos regresionessimples

Datos de ventas y anun-cios para el restaurantePizza Shack

Tabla 13-4 X 1 X 2 Y

Nuacutemero Costo de anuncios Venta tode anuncios publicados de pizz

Mes publicados (cientos de doacutelares) (miles de d

Mayo 12 139 436

Junio 11 120 380

Julio 9 93 301

Agosto 7 97 353

Septiembre 12 123 464

Octubre 8 114 342

Noviembre 6 93 302

Diciembre 13 143 407

Enero 8 102 385

Febrero 6 84 226

Marzo 8 112 376

Abril 10 111 352

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esVENTAS = 16 9 + 2 08 ANUNCI OS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 16 937 4 982 3 40 0 007ANUNCI OS 2 0832 0 5271 3 95 0 003

s = 4 206 R- s q = 61 0

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 1 276 31 276 31 15 62 Er r or 10 176 88 17 69Tot a l 11 453 19

Figura 13-6

Regresioacuten de lasventas sobre elnuacutemero deanuncios conMinitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2656

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2756

gar el nuacutemero de anuncios como segunda variable explicativa ademaacutes del costo de los anuncios eplica nada maacutes alrededor del 1 adicional de la variacioacuten de las ventas totales

En este punto es justo preguntarse iquestqueacute variable realmente explica la variacioacuten de las ventotales en la regresioacuten muacuteltiple La respuesta es que ambas la explican pero no podemos separ

sus contribuciones individuales debido a que estaacuten altamente correlacionadas entre siacute E

consecuencia sus coeficientes en la regresioacuten muacuteltiple tienen errores estaacutendar altos valore

calculados relativamente bajos y valores prob Ͼ | t | relativamente altos

iquestDe queacute manera nos afecta esta multicolinealidad Todaviacutea podemos hacer predicciones relativmente precisas cuando se encuentra presente note que para la regresioacuten muacuteltiple (la salida se dala figura 13-8) el error estaacutendar de la estimacioacuten que determina el ancho de los intervalos de co

fianza para las predicciones es 3989 mientras que para la regresioacuten simple con el costo de los anucios como variable explicativa (salida en la figura 13-7) tenemos se ϭ 3849 Lo que no podemhacer es predecir con mucha precisioacuten coacutemo cambiaraacuten las ventas si aumentamos en uno el nuacutemede anuncios La regresioacuten muacuteltiple dice que b1 ϭ 0625 (esto es cada anuncio aumenta las ventotales de pizzas alrededor de $625) pero el error estaacutendar de este coeficiente es 112 (es decir apximadamente $1120)

Las contribucionesindividuales nopueden separarse

Ejercicios 134

Ejercicios de autoevaluacioacuten

EA 13-4 Edith Pratt es una ocupada ejecutiva de una compantildeiacutea de transporte de carga a nivel nacional y va tara una junta porque no encuentra la salida de la regresioacuten muacuteltiple elaborada por un asistente Si la regsioacuten total es significativa al nivel 005 ella desea usar las salida de computadora como evidencia para fudamentar algunas ideas que expondraacute en la reunioacuten Sin embargo su ayudante estaacute enfermo De hectoda la informacioacuten que tiene de la regresioacuten muacuteltiple es un trozo de papel con los siguientes datos

Regresioacuten paraEdith Pratt

SCR 8724 con gl

SCE con 17 gl

SCT 10236 con 24 gl

Como el papel ni siquiera tiene todos los nuacutemeros Edith ha concluido que no es uacutetil Usted sin embardebe saber maacutes que ella iquestPuede Edith entrar en la junta o debe seguir buscando la salida de computador

EA 13-5 Una pequentildea liacutenea aeacuterea de Nueva Inglaterra realizoacute una encuesta sobre sus 15 terminales y obtuvo losguientes datos para el mes de febrero donde

VENTAS ϭ ingreso total seguacuten el nuacutemero de boletos vendidos (en miles de doacutelares)

PROMOCϭ cantidad gastada en promociones de la liacutenea aeacuterea en el aacuterea (en miles de doacutelares)

COMPET ϭ nuacutemero de liacuteneas aeacutereas que compiten en esa terminal

GRATIS ϭ nuacutemero de pasajeros que vuelan gratis (por diferentes razones)

Sugerencia el concepto de hacer infe-rencias respecto a una regresioacuten muacutelti-ple es justo lo mismo que se hizo en elcapiacutetulo 12 cuando hicimos inferencias

respecto a una recta de regresioacuten excepto que ahora se em-

plean dos o maacutes variables independientes Advertencia lamulticolinealidad es un problema que debe manejarse enla regresioacuten muacuteltiple y es necesario desarrollar una com-prensioacuten con sentido comuacuten Recuerde que todaviacutea puedehacer predicciones precisas cuando estaacute presente Pero re-cuerde tambieacuten que no puede decir con mucha precisioacuten

cuaacutento cambiaraacute la variable dependiente si ldquomanipulardquo lavariables independientes Entonces el objetivo debe seminimizar la multicolinealidad Sugerencia la mejor regresioacuten muacuteltiple es la que explica la relacioacuten entre los datos asentildealar la responsabilidad de la mayor proporcioacuten de la va

riacioacuten en la variable dependiente con el menor nuacutemero dvariables independientes Advertencia no es una buenidea incluir demasiadas variables independientes soacutelo porque cuenta con una computadora y un paquete de softwarpara estadiacutestica

SUGERENCIAS

Y

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2856

Ventas (doacutelares) Promoc (doacutelares) Compet Gratis

793 25 10 3

2001 55 8 6

1632 60 12 9

2001 79 7 16

1460 52 8 15

1777 76 12 9

309 20 12 8

2919 90 5 10

1600 40 8 43394 96 5 16

1596 55 11 7

863 30 12 6

2375 60 6 10

1072 50 10 4

1550 35 10 4

a) Utilice la siguiente salida de Minitab para determinar la ecuacioacuten de regresioacuten que mejor se ara la liacutenea aeacuterea

La ec uaci oacuten de r egr es i oacuten esVENTAS ϭ 172 ϩ 25 9 PROMOVϪ 13 2 COMPET Ϫ 3 04 GRATI S

Pr onos t i cador Coef Des vEs t Coci ent e - t Cons t ant e 172 34 51 38 3 35 0PROMOV 25 950 4 877 5 32 0COMPET - 13 238 3 686 - 3 59 0GRATI S - 3 041 2 342 - 1 30 0

b) iquestLos pasajeros que vuelan gratis ocasionan una disminucioacuten significativa en las ventas Fpruebe las hipoacutetesis apropiadas Use ϭ 005

c) iquestUn incremento de $1000 en las promociones cambia las ventas en $28000 o el cambio ecativamente diferente de $28000 Formule y pruebe las hipoacutetesis adecuadas Use ϭ 010

d) Calcule un intervalo de confianza del 90 para el coeficiente de la pendiente de la COMPET

Aplicaciones

13-22 Mark Lowtown publica el perioacutedico Mosquito Junction Enquirer y tiene problemas para predectidad de papel perioacutedico que necesita imprimir diariamente Eligioacute aleatoriamente 27 diacuteas del arior y registroacute la siguiente informacioacuten

PESO ϭ peso en libras de papel perioacutedico para la edicioacuten de ese diacutea

CLASIFICADOS ϭ nuacutemero de anuncios clasificados

PUBLICIDAD ϭ nuacutemero de anuncios publicitarios

PLANA COMPLETA ϭ nuacutemero de anuncios a una plana

Utilizando Minitab para hacer una regresioacuten de PESO sobre las otras tres variables Mark obtuguiente salida

Pr onos t i cador Coef Des vEs t Coci ent e- t Cons t ant e 1072 95 872 43 1 23 0CLASI FI CADOS 0 251 0 126 1 99 0PUBLI CI DAD 1 250 0 884 1 41 0PLANA COMPLETA 250 66 67 92 3 69 0

a) Mark siempre ha pensado que cada anuncio publicitario utiliza al menos 3 libras de papel iquestsioacuten le da una razoacuten significativa para dudar esto al nivel del 5

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2956

b) De manera similar Mark siempre ha creiacutedo que cada anuncio clasificado utiliza aproximmedia libra de papel iquestTiene ahora Mark una razoacuten significativa para dudar esto al nivel del

c) Mark vende espacios de anuncios de plana completa a los comerciantes locales a $30 la paacutegberaacute pensar en ajustar sus tarifas si el papel perioacutedico le cuesta $009 por libra Suponga costos son despreciables Establezca expliacutecitamente las hipoacutetesis y una conclusioacuten (Sugere

jando todo lo demaacutes constante cada anuncio adicional de plana completa tiene un costo de bras de papel ϫ $009 por libra ϭ $2256 El punto de equilibrio es 333333 libras iquestPor quel coeficiente de pendiente para PLANA COMPLETA es significativamente mayor que Mark no estaacute obteniendo ganancias y debe cambiar sus tarifas)

13-23 Para los datos del ejercicio 13-18 y un nivel de significancia de 010 iquestcuaacuteles variables son sign

mente explicativas de los resultados de los exaacutemenes (Habiacutea 12 estudiantes en la muestra) 13-24 Para los datos del ejercicio 13-18 y la siguiente salida de Minitab del procedimiento de regresiple hecho por Bill

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 3134 42 783 60Er r or 7 951 25 135 89Tot a l 11 4085 67

a) iquestCuaacutel es el valor observado de F b) A un nivel de significancia de 005 iquestcuaacutel es el valor criacutetico de F que se debe utilizar para d

si la regresioacuten como un todo es significativac) Basaacutendose en las respuestas a los incisos a) y b) iquestes la regresioacuten significativa como un tod

13-25 Remiacutetase al ejercicio 13-19 A un nivel de significancia de 001 iquestes la variable DISTANCIA uble explicativa significativa para VENTAS

13-26 Para los datos del ejercicio 13-19 y la siguiente salida adicional de Minitab al correr la regresioacuten

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 2861495 715374 102 39 0Er r or 18 125761 6896 7Tot a l 22 2987256

Al nivel de significancia de 005 iquestes la regresioacuten significativa como un todo

13-27 Henry Lander es el director de produccioacuten de la Alecos Corporation de Caracas Venezuela Hede que le ayude a determinar una foacutermula para predecir el ausentismo de los empacadores de chipoacutetesis es que la temperatura diaria promedio puede explicar el porcentaje de ausentismo Durios meses reuacutene datos ejecuta el procedimiento de regresioacuten simple y encuentra que la tempeplica 66 de la variacioacuten en el ausentismo Pero Henry no estaacute convencido de que eacuteste sea un cador satisfactorio Sugiere que la precipitacioacuten pluvial diaria podriacutea tambieacuten tener algo que vausentismo de modo que registra los datos correspondientes y hace una regresioacuten del ausentismte el tiempo de lluvias y obtiene un valor R2 de 059 ldquoiexclEurekardquo grita usted ldquoiexclLo tengo Con uticador que explica 66 y otro que explica 59 todo lo que tengo que hacer es una regresioacutenutilizando ambos y seguramente tendreacute un pronosticador casi perfectordquo Para su desaacutenimo sin la regresioacuten muacuteltiple tiene una R

2 de soacutelo 68 que es solamente un poco mejor que la variablperatura sola iquestCoacutemo puede explicar esta aparente discrepancia

13-28 Juan Armenlegg administrador de Rockyrsquos Diamond y Jewelry Store estaacute interesado en desamodelo para estimar la demanda del consumidor para su costosa mercanciacutea Como la mayoriacutea de

tes compran diamantes y joyas a creacutedito Juan estaacute seguro de que dos factores que deben influirmanda de los clientes son la tasa real de inflacioacuten anual y la tasa real de intereses sobre preacutestamprincipales bancos del paiacutes Explique algunos problemas que Juan podriacutea encontrar si fuera a dun modelo de regresioacuten basado en estas dos variables de prediccioacuten

13-29 Un nuevo programa de juegos Check That Model pide a los concursantes que especifiquen el nuacutenimo de paraacutemetros que necesitan para determinar si un modelo de regresioacuten muacuteltiple es signifimo un todo para ϭ 001 Usted ganoacute la apuesta con 4 paraacutemetros Use la siguiente informacioacutenterminar si la regresioacuten es significativa

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3056

R 2

ϭ 07452

SCE ϭ 1254

n ϭ 18

Nuacutemero de variables independientes ϭ 3

13-30 La Scottish Turist Agency estaacute interesada en el nuacutemero de turistas que entran al paiacutes cada semanrante la temporada alta Se recolectaron los siguientes datos

Turistas (Y ) ϭ nuacutemero de turistas que entran a Escocia en una semana (en miles)

Cambio (X 1)ϭ nuacutemero de libras escocesas compradas por $1 doacutelar

Precio (X 2) ϭ nuacutemero de libras escocesas cobradas por viaje redondo en camioacuten de Londres a Edimburgo

Promoc (X 3) ϭ cantidad gastada en promocioacuten del paiacutes (en miles de libras escocesas)Temp (X 4) ϭ temperatura media durante la semana en Edimburgo (en grados Celsius)

Turistas (Y ) Cambio (X 1) Precio (X 2) Promoc (X 3) Temp (X 4)

69 061 40 87 154

71 059 40 88 156

68 063 40 85 154

79 061 35 86 153

76 060 35 94 158

82 065 35 99 162

80 058 35 98 164

84 059 35 102 166

97 061 30 114 174

98 062 30 116 172

72 057 40 84 176

67 055 40 86 164

a) Utilice el paquete de software que tenga para determinar la ecuacioacuten de regresioacuten que mejote a los datos de la agencia de turismo

b) iquestEs la tasa de cambio una variable explicativa significativa Establezca y pruebe las hipoacutetesidas a un nivel de significancia de 010

c) Un incremento de 1000 libras en las promociones iquestaumenta el nuacutemero de turistas en maacutesEstablezca y pruebe las hipoacutetesis adecuadas para un nivel de significancia de 005

d) Calcule un intervalo de confianza del 95 para el coeficiente de la pendiente de Temp

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-4 Como SCT ϭ SCR ϩ SCE SCE ϭ SCT Ϫ SCR ϭ 10236 Ϫ 8724 ϭ 1512Como gl SCT ϭ gl SCR ϩ gl SCE gl SCR ϭ gl SCT Ϫ gl SCE ϭ 24 Ϫ 17 ϭ 7

Entonces F ϭ ϭ ϭ 1401

F CRiacuteT ϭ F (7 17 005) ϭ 261Como F OBS gt F CRIacuteT se concluye que la regresioacuten es significativa como un todo Edith debe conticando la salida de computadora de la regresioacuten para usarla en la junta

EA 13-5 De la salida de computadora se obti enen los siguientes resultadosa) VENTAS ϭ 17234 ϩ 25950PROMOC Ϫ13238COMPET Ϫ 3041GRATISb) H0 BGRATIS ϭ 0 H1 BGRATIS Ͻ 0 ϭ 005

Eacutesta es una prueba de una cola y el valor prob en los resultados es para la alternativa de dos c BGRATIS 0 De manera que para esta prueba el valor prob es 02212 ϭ 0111 Ͼ ϭ 00que no se puede rechazar H0 las ventas no disminuyen significativamente cuando aumenta ro de pasajeros que vuelan gratis

c) H0 BPROMOC ϭ 28 H1 BPROMOC 28 ϭ 010

87247ᎏᎏ

151217SCRk ᎏᎏ

SCE(n Ϫ k Ϫ 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3156

El valor observado t de los resultados de regresioacuten es

ϭ ϭ Ϫ0420

Con 11 grados de libertad y ϭ 010 en ambas colas combinadas los valores criacuteticos t parba son Ϯ1796 asiacute el valor observado estaacute dentro de la regioacuten de aceptacioacuten No se rechacambio en VENTAS para un incremento de una unidad ($1000) en PROMOC no es significate diferente de 28 ($28000)

d) Con 11 grados de libertad el valor t para un intervalo del 90 de confianza es 1796 por lo

tervalo esbCOMP Ϯ 1796sbCOMP

ϭ Ϫ13238 Ϯ 1796(3686)

ϭ Ϫ13238 Ϯ 6620 ϭ (Ϫ19858 Ϫ 6618)

La liacutenea aeacuterea puede tener una seguridad del 90 de que el ingreso por los boletos en una ofminuye entre $6600 y $19900 aproximadamente con cada liacutenea aeacuterea adicional que comp

135 Teacutecnicas de modelado

Dada una variable que deseamos explicar y un conjunto de variables explicativas potencialehaya varias ecuaciones de regresioacuten diferentes que podamos estudiar dependiendo de queacute explicativas incluyamos y de coacutemo lo hagamos Cada una de esas ecuaciones de regresioacutence como modelo Las teacutecnicas de modelado son las distintas formas en que podemos incluriables explicativas y verificar queacute tan apropiados son los modelos de regresioacuten Existen municas de modelado diferentes pero soacutelo veremos dos de las maacutes utilizadas

Datos cualitativos y variables ficticias

En todos los ejemplos de regresioacuten que hemos visto hasta ahora los datos manejados hanmeacutericos o cuantitativos Pero ocasionalmente nos enfrentaremos con una variable categoacuterilitativa En el problema del inicio el capiacutetulo el director de personal desea ver si el salarioun vendedor depende de su sexo En la tabla 13-5 repetimos los datos de dicho problema

Por el momento ignore la antiguumledad y utilice la teacutecnica desarrollada en el capiacutetulo 9 bar la diferencia entre las medias de dos poblaciones para ver si los hombres ganan maacutes qu

jeres Pruebe con ϭ 001 Si tomamos a los hombres como la poblacioacuten 1 y a las mujerespoblacioacuten 2 probaremos las siguientes hipoacutetesis

H0 1 ϭ 2 larr Hipoacutetesis nula no existe discriminacioacuten por sexo en los salarios base

H1 1 Ͼ 2 larr Hipoacutetesis alternativa se discrimina a las mujeres en su salario base

ϭ 001 larr Nivel de significancia

Revisioacuten del enfoqueanterior del problema

Buacutesqueda dediferentes modelos

25950 Ϫ 28ᎏᎏ

4877

(bPROMOC Ϫ 28)ᎏᎏ

sbPROMOC

Datos para el problemade discriminacioacuten porsexo

Tabla 13-5 Vendedores VendedorasAntiguumledad Salario base Antiguumledad Salario base(en meses) (en miles) (en meses) (en miles)

6 75 5 62

10 86 13 87

12 91 15 94

18 103 21 98

30 130

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3256

A continuacioacuten bosquejamos el anaacutelisis Si tiene problemas para seguirlo deberaacute repasamente la seccioacuten 93

n1 ϭ 5 n2 ϭ 4

x ෆ1 ϭ 97 x ෆ2 ϭ 8525

s2

1 ϭ 4415 s2

2 ϭ 2609

s2

p ϭ

ϭ

ϭ 3641

x ෆ1Ϫ x

ෆ2ϭ s pΊ ϩ

ϭ 128

t ϭ

ϭ

ϭ 092

Con siete grados de libertad el valor t criacutetico para una prueba de cola superior con ϭ 001 eComo el valor t observado de 092 es menor que 2998 no podemos rechazar H0

Entonces el anaacutelisis concluye que no parece haber discriminacioacuten por sexo en los salarPero recuerde que hasta ahora se han ignorado los datos de antiguumledad laboral para el anaacuteli

Antes de seguir vea el diagrama de dispersioacuten de los datos En la figura 13-9 los punto

corresponden a los hombres y los blancos a las mujeres El diagrama de dispersioacuten muestraridad que el salario base aumenta con los antildeos de antiguumledad pero si con la mirada sigue lo qla recta de regresioacuten notaraacute que los puntos negros tienden a estar arriba de ella y los blancos

La figura 13-10 da la salida de una regresioacuten del salario base sobre los meses de antiguumlelos resultados se ve que la antiguumledad es una variable explicativa altamente significativa

Ademaacutes r 2

ϭ 926 que indica que la variable meses de antiguumledad explica cerca del 9variacioacuten en el salario base La figura 13-11 contiene parte de la salida que no se vio antesbla de residuos Para cada punto el residuo es simplemente Y Ϫ Y ˆ que se reconoce como el

Una ldquomiradardquo a los

datos

El enfoque anterior nodetecta discriminacioacuten

(97 ndash 8525) ndash 0ᎏᎏ

128

( x ෆ1 ndash x ෆ2) ndash (1 Ϫ 2)H0

ᎏᎏᎏ

ˆ x ෆ1Ϫ

x ෆ2

1ᎏ

n2

1ᎏ

n1

4(4415) ϩ 3(2609)ᎏᎏᎏ5 ϩ 4 ndash 2

(n1 ndash 1)s21 ϩ (n2 ndash 1)s22ᎏᎏᎏ

n1 ϩ n2 ndash 2

FIGURA 13-9

Diagrama de dis-persioacuten de salariosbase contra mesesde antiguumledad

4 8 12 16 20 24 28

4

8

12

Meses de antiguumledad

S a l a r i o ( m i l e s d e d oacute l a r e s )

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3356

el ajuste de la recta de regresioacuten en ese punto En la figura 13-11 AJUST1 son los valores y RESI1 son los residuos

Tal vez la parte maacutes importante del anaacutelisis del resultado de una regresioacuten sea estusiduos Si la regresioacuten incluye todos los factores explicativos relevantes estos residuo

ser aleatorios Dicho de otro modo si los residuos muestran cualquier patroacuten no aleat

to indica que hay algo sistemaacutetico que afecta el proceso y que no hemos tomado en cu

manera que buscamos patrones en los residuos o para decirlo de forma maacutes pintoresca ldquopmos a los residuos hasta hacerlos hablarrdquo

Si observamos los residuos presentados en la figura 13-11 vemos que los primeros cincoson positivos De modo que para los vendedores tenemos Y ndash Y ˆ Ͼ 0 o Y Ͼ Y ˆ es decir laregresioacuten cae abajo de estos cinco puntos Tres de los cuatro uacuteltimos residuos son negaticonsiguiente para las vendedoras tenemos Y Ϫ Y ˆ Ͻ 0 o Y Ͻ Y ˆ asiacute que la recta de regresicuentra arriba de tres de los cuatro puntos Esto confirma lo que vimos al observar el diagdispersioacuten de la figura 13-9 Este patroacuten no aleatorio en los residuos sugiere que el sexo siacute etor determinante del salario base

iquestCoacutemo podemos incorporar el sexo de los vendedores dentro del modelo de regresioacutencemos utilizando un dispositivo llamado variable ficticia (o variable indicadora) Para lpuntos que representan a los vendedores esta variable tiene valor de 0 y para los cuatro purepresentan a las vendedoras valdraacute 1 Los datos de entrada para nuestra regresioacuten con variticias se dan en la tabla 13-6

Para los datos de la tabla 13-6 se ajusta una regresioacuten de la forma

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

Uso de variablesficticias

Deteccioacuten depatrones en losresiduos

ldquoPresionar a losresiduosrdquo

Anaacutel i s i s de r e gr e s i oacuten

La ec uac i oacuten de r e gr es i oacuten esSALARI O ϭ 5 81 ϩ 0 233 MESES

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t pCons t a nt e 5 8093 0 4038 14 39 0 000MESES 0 23320 0 02492 9 36 0 000

s ϭ 0 5494 R- s q ϭ 92 6

Anaacute l i s i s de va r i a nz aFUENTE GL SC MC F Re gr e s i oacuten 1 26 443 24 443 87 61 0Er r or 7 2 113 0 302Tot a l 8 28 556

FIGURA 13-10

Regresioacuten conMinitab del salariobase sobre losmeses deantiguumledad

RENGLOacuteN SALARI O AJ UST1 RESI 1

1 7 5 7 2085 0 2914992 8 6 8 1413 0 458684

3 9 1 8 6077 0 4922764 10 3 10 0069 0 2930545 13 0 12 8054 0 1946076 6 2 6 9753 - 0 7752977 8 7 8 8409 - 0 1409288 9 4 9 3073 0 0926649 9 8 10 7066 - 0 906558

FIGURA 13-11

Tabla de residuosde Minitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 856

13-9 Dado el siguiente conjunto de datosa) Calcule el plano de regresioacuten muacuteltipleb) Pronostique Y cuando X 1 ϭ Ϫ1 y X 2 ϭ 4

Y X 1 X 2

6 1 3

10 3 Ϫ1

9 2 4

14 Ϫ2 7

7 3 2

5 6 Ϫ4

Aplicaciones

13-10 Sam Spade duentildeo y gerente general de Stationery Store estaacute preocupado por el comportamienventas de un modelo de reproductor de CD y casetes que se venden en la tienda Se da cuenta de ten muchos factores que podriacutean ayudar a explicarlo pero cree que la publicidad y el precio soncipales determinantes Sam reunioacute los siguientes datos

Ventas Publicidad Precio(unidades vend) (nuacutem de anuncios) (doacutelares)

33 3 125

61 6 115

70 10 140

82 13 130

17 9 145

24 6 140

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir las ventas a partir de la publicidad y b) Si la publicidad es 7 y el precio es $132 iquestqueacute ventas podriacutea pronosticar

13-11 Un productor de comida para cerdos desea determinar queacute relacioacuten existe entre la edad de un cerdo empieza a recibir un complemento alimenticio de reciente creacioacuten el peso inicial del anima

mento de peso en un periodo de una semana con el complemento alimenticio La siguiente infoes resultado de un estudio de ocho lechones

X 1 X 2 Y

Nuacutemero Peso inicial Edad inicial Aumentode lechoacuten (libras) (semanas) de peso

1 39 8 7

2 52 6 6

3 49 7 8

4 46 12 10

5 61 9 9

6 35 6 5

7 25 7 38 55 4 4

a) Calcule la ecuacioacuten de miacutenimos cuadrados que mejor describa estas tres variablesb) iquestCuaacutento podemos esperar que un cerdo aumente de peso en una semana con el complemento

ticio si teniacutea nueve semanas de edad y pesaba 48 libras 13-12 Una estudiante graduada que quiere comprar un auto Neptune usado investigoacute los precios Pien

antildeo del modelo y el nuacutemero de millas recorridas influyen en el precio de compra Los datos siguirresponden a 10 autos con precio (Y ) en miles de doacutelares antildeo ( X 1) y millas recorridas ( X 2) en ma) Encuentre (calcule) la ecuacioacuten de miacutenimos cuadrados que mejor relacione estas tres variabb) La estudiante desea comprar un Neptune 1991 con alrededor de 40000 millas recorridas

pronostica que pagaraacute

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 956

(Y ) X 2

Precio X 1 Millas(miles de doacutelares) Antildeo (miles)

299 1987 556

602 1992 184

887 1993 213

392 1988 469

955 1994 118

905 1991 364

937 1992 282

42 1988 44248 1989 349

574 1991 264

13-13 La Reserva Federal de Estados Unidos realiza un estudio preliminar para determinar la relacioacuten etos indicadores econoacutemicos y el cambio porcentual anual en el producto interno bruto (PIB) Dindicadores examinados son el monto del deacuteficit del gobierno federal (en miles de millones de del promedio industrial Dow Jones (el valor medio del antildeo) Los datos correspondientes a seis antilde

Y X 1 X 2

Cambio en el PIB Deacuteficit federal Dow Jones

25 100 2850

Ϫ10 400 2100

40 120 330010 200 2400

15 180 2550

30 80 2700

a) Encuentre (calcule) la ecuacioacuten de miacutenimos cuadrados que mejor describa los datosb) iquestQueacute porcentaje de cambio en el PIB se esperariacutea en un antildeo en el cual el deacuteficit federal fue

millones de doacutelares y el promedio Dow Jones fue 3000

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-1 a) Y X 1 X 2 X 1Y X 2Y X 1X 2 X 2

1 X 2

2

25 35 50 875 1250 175 1225 2500

30 67 42 2010 1260 2814 4489 1764

11 15 85 165 935 1275 225 7225

22 03 14 66 308 042 009 196

27 46 36 1242 972 1656 2116 1296

19 20 13 380 247 260 400 169

1 ෆ3 ෆ4 ෆ 1 ෆ8 ෆ ෆ6 ෆ 2 ෆ4 ෆ ෆ0 ෆ 4 ෆ7 ෆ3 ෆ ෆ8 ෆ 4 ෆ9 ෆ7 ෆ ෆ2 ෆ 7 ෆ7 ෆ ෆ9 ෆ7 ෆ 8 ෆ4 ෆ ෆ6 ෆ4 ෆ 1 ෆ3 ෆ1 ෆ ෆ5 ෆ0 ෆ

Las ecuaciones 13-2 13-3 y 13-4 se convierten en

Y ϭ na ϩ b1 X 1 ϩ b2 X 2 134 ϭ 6 a ϩ 186b1 ϩ 240 b2

X 1Y ϭ a X 1 ϩ b1 X 21 ϩb2 X 1 X 2 4738 ϭ 186a ϩ 8464b1 ϩ 7797b2

X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22 4972 ϭ 240a ϩ 7797b1 ϩ 13150b2

Al resolver estas ecuaciones de manera simultaacutenea se obtiene

a ϭ 203916 b1 ϭ 23403 b2 ϭ Ϫ13283

De modo que la ecuacioacuten de regresioacuten es Y ˆ ϭ 203916 ϩ 23403 X 1 Ϫ 13283 X 2b) Con X 1 ϭ 30 y X 2 ϭ 27

Y ˆ = 203916 ϩ 23403(30) Ϫ 13283(27) ϭ 2883

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1056

EA 13-2 a) En este problema Y ϭ renta X 1 ϭ nuacutemero de habitaciones X 2 ϭ distancia al centro

Y X 1 X 2 X 1Y X 2Y X 1X 2 X 2

1 X 2

2 Y 2

360 2 1 720 360 2 4 1 129600

1000 6 1 600 1000 6 36 1 1000000

450 3 2 1350 900 6 9 4 202500

525 4 3 2100 1575 12 16 9 272625

350 2 10 700 3500 20 4 100 122500

300 1 4 300 1200 4 1 16 90000

2985 18 21 11170 8535 50 70 131 1820225

Las ecuaciones 13-2 13-3 y 13-4 se convierten en

Y ϭ na ϩ b1 X 1 ϩb2 X 2 2985 ϭ 6a ϩ 18b1 ϩ 21b2

X 1Y ϭ a X 1 ϩ b1 X 21 ϩb2 X 1 X 2 11170 ϭ 18a ϩ 70b1 ϩ 50b2

X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22 8535 ϭ 21a ϩ 50b1 ϩ 131b2

Al resolver estas ecuaciones simultaacuteneas se obtiene

a ϭ 964581 b1 ϭ 1364847 b2 ϭ Ϫ24035

De manera que la ecuacioacuten de regresioacuten es

Y ˆ ϭ 964581 ϩ 1364847 X 1 Ϫ 24035 X 2

b) Cuando el nuacutemero de habitaciones ϭ 2 y la distancia al centro ϭ 2

Y ˆ ϭ 964581 ϩ 1364847(2) Ϫ 24035(2) ϭ $365

133 La computadora y la regresioacutenmuacuteltiple

En el capiacutetulo 12 y hasta donde vamos de eacuteste hemos presentado problemas simplificados y muestrasde tamantildeo pequentildeo Despueacutes del ejemplo de la seccioacuten anterior probablemente usted haya llegadoa la conclusioacuten de que no estaacute interesado en la regresioacuten si tiene que hacer los caacutelculos a mano Dehecho conforme aumenta el tamantildeo de las muestras y crece el nuacutemero de variables independientespara la regresioacuten hacer los caacutelculos incluso con la ayuda de una calculadora de bolsillo se convier-te en algo muy inconveniente

Sin embargo como administradores debemos manejar problemas complejos que requieren mues-tras maacutes grandes y variables independientes adicionales Como ayuda para resolver estos problemasmaacutes detallados utilizaremos una computadora que nos permitiraacute realizar un gran nuacutemero de caacutelcu-los en poco tiempo

Suponga que tenemos no una ni dos variables independientes sino un nuacutemero k de ellas X 1

X 2 X k Como antes sea n el nuacutemero de datos que se tienen La ecuacioacuten de regresioacuten que inten-tamos estimar es

Inconvenienciadel caacutelculo deregresiones a mano

Ecuacioacuten de estimacioacuten de regresioacuten muacuteltiple

Y ˆ ϭ

b1 X 1ϩ

b2 X 2ϩ ϩ

bk X k [13-5]

Ahora veremos coacutemo podemos utilizar una computadora para estimar los coeficientes de regresioacutenPara demostrar coacutemo una computadora maneja el anaacutelisis de regresioacuten muacuteltiple tomemos el pro-

blema del Servicio Interno de Contribuciones (IRS) de la seccioacuten anterior Suponga que el departa-mento de auditoriacuteas agrega a su modelo la informacioacuten correspondiente a las recompensas para losinformantes La dependencia desea incluir esta tercera variable independiente X 3 debido a que sien-

Demostracioacuten de laregresioacuten muacuteltipleen la computadora

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1156

te que existe cierta relacioacuten entre estas recompensas y el descubrimiento de impuestos no pEn la tabla 13-3 se registroacute la informacioacuten de los uacuteltimos 10 meses

Para resolver este problema la divisioacuten de auditoriacutea usoacute el procedimiento de regresioacutende Minitab Por supuesto todaviacutea no sabemos coacutemo interpretar la solucioacuten que proporciocomo veremos la mayor parte de los nuacutemeros dados en la solucioacuten corresponden muy de c

los estudiados en el contexto de regresioacuten simple

Salida de Minitab

Una vez que se introducen los datos y se eligen las variables dependiente e independientescalcula los coeficientes de regresioacuten y varios estadiacutesticos asociados con la ecuacioacuten de regrveraacute la salida del programa para el problema del IRS La figura 13-2 da la primera parte de la

1 La ecuacioacuten de regresioacuten De los nuacutemeros dados en la columna Coef se puede leercioacuten de estimacioacuten

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ b3 X 3

ϭ Ϫ45796 ϩ 0597 X 1 ϩ 1177 X 2 ϩ 0405 X 3

Podemos interpretar esta ecuacioacuten en una forma similar a la de la ecuacioacuten de regresioacutevariables en la paacutegina 558 Si se mantienen constantes el nuacutemero de horas de audicampo X 1 y el nuacutemero de horas de computadora X 2 y se cambian las recompeninformantes X 3 entonces el valor de Y ˆ aumentaraacute $405000 por cada $1000 pagadosformantes De igual manera al mantener X 1 y X 3 constantes se ve que por cada 1adicionales de tiempo de computadora Y ˆ aumentaraacute $1177000 Por uacuteltimo si se dej

Buacutesqueda e interpre-tacioacuten de la ecuacioacutende regresioacuten

Salida del programaMinitab

Uso de Minitab pararesolver problemasde regresioacuten muacuteltiple

Factores relacionadoscon el descubrimientode impuestos nopagados

Tabla 13-3 Horas en Impueauditoriacuteas Horas Recompensa pagde campo en computadora a informantes descub(cientos) (cientos) (miles) (mill

Mes X 1 X 2 X 3

Enero 45 16 71 2

Febrero 42 14 70 2

Marzo 44 15 72 2

Abril 45 13 71 2

Mayo 43 13 75 2

Junio 46 14 74 2

Julio 44 16 76 3

Agosto 45 16 69 2

Septiembre 44 15 74 2

Octubre 43 15 73 2

FIGURA 13-2

Salida de Minitabpara la regresioacuten

del ServicioInterno deContribuciones

Anaacutel i s i s de r e gr e s i oacuten

La ec ua ci oacuten de r egr es i oacuten es

DESCUBRE ϭ mdash45 0 ϩ 0 597 AUDI T ϩ 1 18 COMPUTADORA ϩ 0 405 RECOMPENS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e Ϫ45 796 4 878 Ϫ9 39 0 000AUDI T 0 50697 0 08112 7 36 0 000COMPUTADORA 1 17684 0 08407 14 00 0 000RECOMPENSA 0 40511 0 04223 9 59 0 000

s ϭ 0 2861 R- s q ϭ 98 3

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1256

tantes X 2 y X 3 se estima que 100 horas adicionales dedicadas a auditoriacuteas de campo descubri-raacuten $597000 adicionales de impuestos no pagados Observe que se redondearon los valoresproporcionados por la regresioacuten dada por Minitab (figura 13-2)

Suponga que en noviembre el IRS intenta dejar las horas de trabajo en auditoriacuteas de cam-po y las horas en computadora en sus niveles de octubre (4300 y 1500) pero decide aumen-tar las recompensas pagadas a los informantes a $75000 iquestCuaacutento de impuestos no pagadosesperan descubrir en noviembre Sustituyendo estos valores en la ecuacioacuten de regresioacuten esti-mada obtenemos

Y ˆ ϭ Ϫ45796 ϩ 0597 X 1 ϩ 1177 X 2 ϩ 0405 X 3

Y ˆ ϭ Ϫ45796 ϩ 0597(43) ϩ 1177(15) ϩ 0405(75)

Y ˆ ϭ Ϫ45796 ϩ 25671 ϩ 17655 ϩ 30375

Y ˆ ϭ 27905 larr Descubrimientos estimados $27905000

De modo que el departamento de auditoriacuteas espera descubrir aproximadamente $28 millonesde evasioacuten de impuestos en noviembre

2 Una medida de dispersioacuten el error estaacutendar de la estimacioacuten de la regresioacuten muacuteltiple Ya quehemos determinado la ecuacioacuten que relaciona a nuestras tres variables necesitamos una me-dida de la dispersioacuten alrededor de este plano de regresioacuten muacuteltiple En la regresioacuten simple laestimacioacuten es maacutes precisa conforme el grado de dispersioacuten alrededor de la regresioacuten es menorLo mismo es cierto para los puntos de la muestra que se encuentran alrededor del plano de re-gresioacuten muacuteltiple Para medir esta variacioacuten debemos utilizar de nuevo la medida conocida co-

mo error estaacutendar de la estimacioacuten

Medicioacuten de ladispersioacuten alrededordel plano de regre-sioacuten muacuteltiple usodel error estaacutendar dela estimacioacuten

Error estaacutendar de la estimacioacuten

se ϭ Ί [13-6]Y ndash Y ˆ )2ᎏᎏ

n Ϫ k Ϫ 1

donde

bull Y ϭ valores muestrales de la variable dependientebull Y ˆ ϭ valores correspondientes estimados con la ecuacioacuten de regresioacutenbull n ϭ nuacutemero de puntos de la muestrabull k ϭ nuacutemero de variables independientes (ϭ 3 en nuestro ejemplo)

El denominador de esta ecuacioacuten indica que en la regresioacuten muacuteltiple con k variables in-

dependientes el error estaacutendar tiene n Ϫ k Ϫ 1 grados de libertad Esto se debe a que los

grados de libertad se reducen de n en k ϩ 1 constantes numeacutericas a b1 b2 hellip b k que se

estimaron a partir de la misma muestra

Para calcular se observamos los errores individuales (Y Ϫ Y ˆ ) en el plano de regresioacuten ajus-tado los elevamos al cuadrado calculamos su media (dividiendo entre n Ϫ k Ϫ 1 en lugar den) y tomamos la raiacutez cuadrada del resultado Debido a la forma en que se calcula se se cono-ce a veces como raiacutez del error cuadraacutetico medio [o raiacutez de mse (mean-square error)] De lasalida de Minitab que usa s en lugar de se para denotar el error estaacutendar vemos que la raiacutez demse en el problema del Servicio Interno de Contribuciones es 0286 es decir $286000

Como en el caso de la regresioacuten simple podemos utilizar el error estaacutendar de la estimacioacuteny la distribucioacuten t para formar un intervalo de confianza alrededor de nuestro valor estimadoY ˆ En el problema de la evasioacuten de impuestospara 4300 horas de trabajo en auditoriacuteas de cam-po 1500 horas en computadora y $75000 de pago a informantes Y ˆ es $27905000 como es-timacioacuten de impuestos no pagados descubiertos y se es $286000 Si deseamos construir unintervalo de confianza del 95 alrededor de esta estimacioacuten de $27905000 miramos enla tabla 2 del apeacutendice en la columna del 5 y localizamos ahiacute el rengloacuten correspondiente a

Intervalos deconfianza para Y ˆ

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1356

n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad El valor apropiado de t para nuestracioacuten del intervalo es de 2447 En consecuencia podemos calcular los liacutemites de nutervalo de confianza como sigue

Y ˆ ϩ t (se) ϭ 27905000 ϩ (2447)(286000)

Y ˆ ϩ t(se) ϭ 27905000 ϩ 699800

Y ˆ ϩ t(se) ϭ 28604800 larr Liacutemite superior

Y ˆ Ϫ t (se) ϭ 27905000 Ϫ (2447)(286000)

Y ˆ ϩ t(se) ϭ 27905000 ndash 699800

Y ˆ ϩ t(se) ϭ 27205200 larr Liacutemite inferior

Con un nivel de confianza del 95 el departamento de auditoriacuteas puede sentirse sque los descubrimientos reales estaraacuten en este intervalo que va de $27205200 a $28Si el IRS desea usar un nivel de confianza menor como 90 puede reducir el intevalores para la estimacioacuten de descubrimientos de impuestos no pagados Igual que cgresioacuten simple podemos utilizar la distribucioacuten normal estaacutendar (tabla 1 del apeacutendaproximar la distribucioacuten t siempre que los grados de libertad (n menos el nuacutemero cientes de regresioacuten estimados) sea un nuacutemero mayor que 30

Al antildeadir la tercera variable independiente (recompensas a informantes) iquestmejoroacuteregresioacuten Como se mide la dispersioacuten de los datos alrededor del plano de regresioacutenmenores de se deberiacutean indicar mejores regresiones Para la regresioacuten de dos variablecimos con anterioridad en este mismo capiacutetulo se resultoacute ser 1076 Como al agregarra variable se se redujo a 0286 vemos que siacute mejoroacute el ajuste de la regresioacuten en este Sin embargo en general no es cierto que al agregar variables siempre se reduzc

3 El coeficiente de determinacioacuten muacuteltiple Al estudiar el anaacutelisis de correlacioacuten simpmos la fuerza de la relacioacuten entre dos variables utilizando el coeficiente de determinla muestra r 2 Este coeficiente de determinacioacuten es la fraccioacuten de la variacioacuten total riable dependiente Y que se explica con la ecuacioacuten de estimacioacuten

Similarmente en la correlacioacuten muacuteltiple mediremos la fuerza de la relacioacuten entre trbles utilizando el coeficiente de determinacioacuten muacuteltiple R

2 o su raiacutez cuadrada R (el cte de correlacioacuten muacuteltiple) Este coeficiente de determinacioacuten muacuteltiple es tambieacuten la

que representa la porcioacuten de la variacioacuten total de Y que ldquoexplicardquo el plano de regr

Note que la salida del programa da el valor 983 para R2 Esto nos dice que las tr

bles independientes explican el 983 de la variacioacuten total de impuestos no pagadobiertos Para la regresioacuten de dos variables hecha antes R2 es soacutelo 0729 asiacute que las trabajo en auditoriacutea de campo y las horas en computadora explican el 729 de la vaagregar las recompensas a los informantes explica el 254 restante de la variacioacuten

Todaviacutea no hemos explicado los nuacutemeros en las columnas etiquetadas con Desvciente t y p de la figura 13-2 Estos nuacutemeros se utilizaraacuten para hacer inferencias acercano de regresioacuten de la poblacioacuten tema que se trataraacute en la seccioacuten 13-4

Uso del coeficientede determinacioacutenmuacuteltiple

Valor de variablesadicionales

Interpretacioacuten delintervalo deconfianza

Ya nadie calcula regresiones a mano hayotras cosas maacutes interesantes en queacute ocu-par nuestro tiempo Se explicoacute la teacutecnicacalculando las soluciones a mano para

que no tenga que pensar en su computadora como en unaldquocaja negrardquo que hace muchas cosas uacutetiles que no puedeexplicar Sugerencia el valor real de usar la computadorapara calcular regresiones muacuteltiples es que puede manejarmuchas variables independientes y obtener una mejor ecua-

cioacuten de estimacioacuten que puede medir si agregar otrble independiente realmente mejora los resultados yposible observar con rapidez el comportamiento de

indica la proporcioacuten de la variacioacuten total de la variapendiente que se explica con las variables indepenLa computadora hace todo el trabajo tedioso mdashsin semdash y le deja tiempo para el trabajo maacutes importcomprender los resultados y usarlos para tomar mdecisiones

SUGERENCIASY

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1456

La ec uac i oacuten de r egr es i oacuten esY = - 12 75 + 17 1 X1 + 0 54 1 X2 - 0 17 4 X3

Pr onos t i c ador Coe f De s vEs t Coc i e nt e - t pCons t a n t e - 1275 2699 - 0 47 0 719X1 17 059 6 908 2 47 0 245X2 0 5406 0 3144 1 72 0 335X3 - 0 1743 0 1005 - 1 73 0 333

s = 396 1 R- s q = 87 2

b) iquestQueacute porcentaje de la variacioacuten total del nuacutemero de solicitudes urgentes de devolucioacuten de impuestosexplica esta ecuacioacuten

c) Para este antildeo el iacutendice econoacutemico es 169 la poblacioacuten residente en un radio de una milla desde la

oficina es 10212 habitantes y el ingreso promedio en Ithaca es $26925 iquestCuaacutentas solicitudes urgen-tes de devolucioacuten de impuestos debe Pam esperar procesar entre el 1 de marzo y el 15 de abril

Conceptos baacutesicos 13-14 Dado el siguiente conjunto de datos utilice el paquete de software que tenga disponible para encontrar la

ecuacioacuten de regresioacuten de mejor ajuste y responda a lo siguientea) iquestCuaacutel es la ecuacioacuten de regresioacutenb) iquestCuaacutel es el error estaacutendar de la estimacioacutenc) iquestCuaacutel es el valor de R

2 para esta regresioacutend) iquestCuaacutel es el valor pronosticado para Y cuando X 1 ϭ 58 X 2 ϭ 42 y X 3 ϭ 51

Y X 1 X 2 X 3

647 35 53 85809 74 16 26246 25 63 45439 37 94 88777 55 14 36206 83 92 25669 67 25 27343 12 22 13

Ejercicios 133

Ejercicios de autoevaluacioacuten

EA 13-3 Pam Schneider posee y opera un despacho de contadores en Ithaca Nueva York Ella piensa que seriacutea uacutetilpredecir el nuacutemero de solicitudes urgentes de devolucioacuten de impuestos que le pediraacuten durante el ajetrea-do periodo del 1 de marzo al 15 de abril para poder planear mejor sus necesidades de personal duranteesta eacutepoca Tiene la hipoacutetesis de que varios factores pueden ser uacutetiles para su pronoacutestico Los datos de es-tos factores y el nuacutemero de solicitudes urgentes de devolucioacuten de impuestos de antildeos pasados son

Y X 2 Nuacutemero de

Poblacioacuten solicitudesresidente X 3 de devolucioacuten

X 1 en un radio Ingreso urgentesIacutendice de una milla promedio (1 de marzo

econoacutemico desde la oficina en Ithaca a 15 de abril)

99 10188 21465 2306106 8566 22228 1266100 10557 27665 1422129 10219 25200 1721179 9662 26300 2544

a) Use el siguiente resultado de Minitab para determinar la ecuacioacuten de regresioacuten maacutes adecuada para es-

tos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1556

13-15 Dado el siguiente conjunto de datos utilice el paquete de software que tenga a su disposicioacuten patrar la ecuacioacuten de regresioacuten de mejor ajuste y responda a lo siguientea) iquestCuaacutel es la ecuacioacuten de regresioacutenb) iquestCuaacutel es el error estaacutendar de la estimacioacutenc) iquestCuaacutel es el valor de R2 para esta regresioacutend) Deacute un intervalo de confianza para la estimacioacuten del 95 para el valor Y cuando los valores X

y X 4 son 524 416 358 y 3 respectivamente

X 1 X 2 X 3 X 4 Y

214 629 219 Ϫ2 228

517 407 429 5 937418 818 698 2 649

118 410 909 Ϫ4 192

716 226 129 8 558

919 615 309 1 231

Aplicaciones

1316 Las estaciones de policiacutea en Estados Unidos estaacuten interesadas en predecir el nuacutemero de arrestodos que deberaacuten procesar cada mes para programar mejor a los empleados de oficina En los daricos el nuacutemero promedio de arrestos (Y ) cada mes tiene influencia del nuacutemero de oficiales en

policiaca ( X 1) la poblacioacuten de la ciudad en miles ( X 2) y el porcentaje de personas desempleadasdad en miles ( X 3) Los datos de estos factores en 15 ciudades se presentan en la tablaa) Utilice el paquete de software que tenga disponible para determinar la ecuacioacuten de regresioacuten

jor se ajuste a estos datosb) iquestQueacute porcentaje de la variacioacuten total en el nuacutemero de arrestos (Y ) explica esta ecuacioacutenc) El departamento de policiacutea de ChapelBoro desea pronosticar el nuacutemero de arrestos mensua

pelBoro tiene una poblacioacuten de 75000 habitantes 82 elementos en su fuerza policiaca y utaje de desempleo del 105 iquestCuaacutentos arrestos pronostica para cada mes

Nuacutemero promedio Nuacutemero de oficiales Tamantildeo de la ciudad (X 2) Porcende arrestos mensuales (Y ) en la fuerza (X 1) en miles de habitantes desemp

3906 68 816 4

5043 94 751 3

6284 125 973 5

7456 175 1235 8

5852 113 1184 11

4503 82 654 9

3278 46 616 12

2605 32 543 18

4775 89 974 4

3898 67 824 6

3124 47 564 8

3675 59 713 7

3744 61 674 9

4946 87 963 11

4875 92 864 4

13-17 Estamos intentando predecir la demanda anual (DEMAND) de cierto producto utilizando las svariables independientes

PRECIO ϭ precio del producto (en doacutelares)

INGRESO ϭ ingreso del consumidor (en doacutelares)

SUB ϭ precio de un bien sustituto (en doacutelares)

( Nota Un bien sustituto es aquel que puede suplir a otro bien Por ejemplo la margarina es untituto de la mantequilla)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1656

Se recolectaron datos correspondientes al periodo 1982-1996

Antildeo Demanda Precio ($) Ingreso ($) Sub ($)

1982 40 9 400 101983 45 8 500 141984 50 9 600 121985 55 8 700 131986 60 7 800 111987 70 6 900 151988 65 6 1000 161989 65 8 1100 17

1990 75 5 1200 221991 75 5 1300 191992 80 5 1400 201993 100 3 1500 231994 90 4 1600 181995 95 3 1700 241996 85 4 1800 21

a) Utilice el paquete de software que tenga disponible para encontrar la ecuacioacuten de regresioacuten ajuste para estos datos

b) iquestSon los signos (ϩ o Ϫ) de los coeficientes de regresioacuten de las variables independientes los qperan Deacute una explicacioacuten breve ( Nota Eacutesta no es una pregunta estadiacutestica soacutelo necesita pesignifican los coeficientes de regresioacuten)

c) Establezca e interprete el coeficiente de determinacioacuten muacuteltiple del problemad) Establezca e interprete el error estaacutendar de la estimacioacuten para el problemae) Seguacuten la ecuacioacuten de regresioacuten obtenida iquestqueacute valor de DEMAND predeciriacutea si el precio de

ductos fue $6 el ingreso del consumidor $1200 y el precio del bien sustituto $17 13-18 Bill Buxton profesor de estadiacutestica de una prominente escuela de administracioacuten tiene un prof

tereacutes en los factores que afectan el desempentildeo de los estudiantes en los exaacutemenes El examen psemestre anterior tuvo una distribucioacuten de calificaciones amplia pero Bill tiene la certeza de qfactores explican esa distribucioacuten permite a sus estudiantes que estudien en tantos libros comoca el coeficiente de inteligencia de los estudiantes variacutea tienen distintas edades y difieren losque dedican a estudiar Con el propoacutesito de desarrollar una foacutermula de prediccioacuten para las califde los exaacutemenes Bill pidioacute a cada estudiante que respondiera al final del examen preguntas refe

tiempo de estudio y nuacutemero de libros utilizados Los registros que teniacutea Bill ya incluiacutean el coefiinteligencia y la edad de modo que reunioacute los datos del grupo y corrioacute la regresioacuten muacuteltiple deLa salida de la corrida de Bill fue la siguiente

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t Con s t a nt e minus49 948 41 55 minus1 20 0HORAS 1 06931 0 98163 1 09 0CI 1 36460 0 37627 3 63 0LI BROS 2 03982 1 50799 1 35 0EDAD minus1 79890 0 67332 minus2 67 0

s = 11 657 R- s q = 76 7

a) iquestCuaacutel es la ecuacioacuten de regresioacuten de mejor ajuste para estos datos

b) iquestQueacute porcentaje de la variacioacuten en las calificaciones se explica con esta ecuacioacutenc) iquestQueacute calificacioacuten esperariacutea usted para un estudiante de 21 antildeos de edad con un coeficiente gencia (CI) de 113 que estudioacute durante cinco horas y utilizoacute tres libros diferentes

13-19 La compantildeiacutea de tiendas de abarrotes Twenty-Two estaacute planeando expandir su cadena Como ayudleccionar los lugares donde abriraacute las nuevas tiendas recolectoacute datos de las ventas semanales de casus 23 tiendas Para explicar la variabilidad de las ventas semanales tambieacuten reunioacute informacioacutencribe cuatro variables que se cree estaacuten relacionadas con las ventas Las variables se definen como

VENTAS ϭ ventas semanales promedio en cada tienda en miles de doacutelares

AUTOS ϭ volumen promedio de traacutensito de automoacuteviles por semana en miles de autos

ENTRADA ϭ facilidad de entradasalida medida en una escala de 1 a 100

INGANUAL ϭ ingreso anual promedio por familia en el aacuterea en miles de doacutelares

DISTANCIA ϭ distancia en millas desde la tienda al supermercado maacutes cercano

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1756

Los datos se analizaron con Minitab y la salida es la siguiente

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t Cons t a nt e 175 37 92 62 1 89 0 0AUTOS - 0 028 0 315 minus0 09 0 9ENTRADA 3 775 1 272 2 97 0 0I NGANUAL 1 990 4 510 0 44 0 6DI STANCI A 212 41 28 090 7 56 0 0

s = 85 587 R- s q = 95 8

a) iquestCuaacutel es la ecuacioacuten de regresioacuten de mejor ajuste dada por Minitab

b) iquestCuaacutel es el error estaacutendar de la estimacioacuten para esta ecuacioacutenc) iquestQueacute fraccioacuten de la variacioacuten en las ventas se explica con esta regresioacutend) iquestQueacute ventas predeciriacutea para una tienda localizada en un vecindario que tuvo un ingreso anu

milia de $20000 estaba a 2 millas del supermercado maacutes cercano se encontraba en una calvolumen promedio semanal de traacutensito de 100000 autos y con una facilidad de entrada de

13-20 Rick Blackburn estaacute pensando en vender su casa Con el fin de decidir el precio que pediraacute poreunido datos de 12 ventas recientes Registroacute el precio de venta (en miles de doacutelares) el nuacutemercuadrados de construccioacuten (en cientos de pies cuadrados) el nuacutemero de pisos el nuacutemero de bantiguumledad de la casa (en antildeos)

Precio de venta Pies cuad Pisos Bantildeos Antiguumledad

4965 89 1 10 2

6795 95 1 10 68115 126 2 15 11

8160 129 2 15 8

9150 190 2 10 22

9525 176 1 10 17

10035 200 2 15 12

10425 206 2 15 11

11265 205 1 20 9

14970 251 2 20 8

16065 227 2 20 18

23250 408 3 40 12

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de

de mejor ajuste para los datosb) iquestCuaacutel es el valor de R2 para esta ecuacioacutenc) Si la casa de Rick tiene 1800 pies cuadrados (ϭ 180 cientos de pies cuadrados) un piso

y seis antildeos de antiguumledad iquestqueacute precio de venta puede esperar Rick 13-21 La Allegheny Steel Corporation ha estado buscando los factores que influyen en la cantidad de

millones de toneladas) que puede vender cada antildeo La administracioacuten sospecha que los siguientfactores principales la tasa anual de inflacioacuten del paiacutes el precio promedio por tonelada del acetado que acota los precios (en doacutelares) de Allegheny y el nuacutemero de automoacuteviles (en millonesfabricantes de autos de Estados Unidos planean producir ese antildeo Se recolectaron los datos de losiete antildeos

Y X 2 X 3

Millones X 1 Cota de Nuacutemero

de tons Tasa de importa- deAntildeo vendidas inflacioacuten ciones automoacuteviles

1993 42 31 310 62

1992 31 39 500 51

1991 40 75 220 57

1990 47 107 450 71

1989 43 155 435 65

1988 37 130 260 61

1987 35 110 305 59

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1856

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de regresioacutende mejor ajuste para los datos

b) iquestQueacute porcentaje de la variacioacuten total de la cantidad de acero vendido (en millones de toneladas) porAllegheny cada antildeo explica esta ecuacioacuten

c) iquestCuaacutentas toneladas de acero deberaacute esperar Allegheny vender en un antildeo en el que la tasa de inflacioacutenes 71 los fabricantes de automoacuteviles norteamericanos planean producir 60 millones de autos y la co-ta promedio del acero importado por tonelada es $350

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-3 De la salida del paquete de software se obtienen los siguientes resultadosa) Y ˆ ϭ Ϫ1275 ϩ 17059 X 1 ϩ 05406 X 2 Ϫ 01743 X 3b) R

2ϭ 872 el modelo explica el 872 de la variacioacuten total en Y

c) Y ˆ ϭ Ϫ1275 ϩ 17059(169) ϩ 05406(10212) Ϫ 01743(26925) ϭ 2436 reembolsos de impuestos

134 Inferencias sobre paraacutemetrosde poblacioacuten

En el capiacutetulo 12 se vio que la recta de regresioacuten de la muestra Y ˆ ϭ a ϩ bX (ecuacioacuten 12-3) esti-maba la recta de regresioacuten de la poblacioacuten Y ϭ A ϩ BX (ecuacioacuten 12-13) La razoacuten por la cual soacute-lo podiacuteamos estimar la recta de regresioacuten de poblacioacuten y no determinarla con exactitud era que los

puntos no caen exactamente en la recta de regresioacuten de la poblacioacuten Debido a las variaciones alea-torias los puntos satisfaciacutean Y ϭ A ϩ BX ϩ e (ecuacioacuten 12-13a) maacutes que a Y ϭ A ϩ BX

En la regresioacuten muacuteltiple se tiene justo la misma situacioacuten Nuestro plano de regresioacuten estimado

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k [13-5]

es una estimacioacuten de un plano de regresioacuten de poblacioacuten verdadero pero desconocido de la forma

Plano de regresioacutende la poblacioacuten

De nuevo los puntos individuales normalmente no caen con exactitud en el plano de regresioacuten depoblacioacuten Consideremos el problema del Servicio Interno de Contribuciones para ver por queacute Notodos los pagos a informantes tendraacuten la misma efectividad Algunas horas en computadora podriacuteanutilizarse para recolectar y organizar datos otras para analizar esos datos en busca de errores y frau-des El eacutexito de la computadora en descubrir impuestos no pagados puede depender de cuaacutento tiempose dedique a cada una de estas actividades Por eacutestas y otras razones algunos de los puntos se en-contraraacuten arriba del plano de regresioacuten y algunos estaraacuten abajo de eacuteste En lugar de satisfacer laecuacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

los puntos individuales satisfaraacuten la ecuacioacuten

Las variaciones alea-torias desplazan lospuntos del plano deregresioacuten

Ecuacioacuten de regresioacuten de la poblacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

Plano de regresioacuten de la poblacioacuten maacutes la variacioacuten aleatoria

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e [13-7a]

La cantidad e que aparece en la ecuacioacuten 13-7a es una variacioacuten aleatoria que en promedio es iguala cero La desviacioacuten estaacutendar de las variaciones individuales e y el error estaacutendar de la estima-cioacuten se que estudiamos en la seccioacuten anterior es una estimacioacuten de e

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1956

Como nuestro plano de regresioacuten de la muestra Y ˆ ϭ a ϩ b1X1 ϩ b2 X 2 ϩ ϩ bk X k (ecuaci13-7) estima el plano de regresioacuten de poblacioacuten desconocido Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk

(ecuacioacuten 13-7) deberemos ser capaces de usarlo para hacer inferencias sobre el plano de regreside la poblacioacuten En esta seccioacuten haremos inferencias acerca de las pendientes ( B1 B2 Bk ) deecuacioacuten de regresioacuten ldquoverdaderardquo (la que se aplica a la poblacioacuten completa) basadas en las pendietes (b1 b2 bk ) de la ecuacioacuten de regresioacuten estimada a partir de la muestra de datos

Inferencias acerca de una pendiente individual B i El plano de regresioacuten se deriva de una muestra y no de la poblacioacuten completa Como resultado

podemos esperar que la ecuacioacuten de regresioacuten verdadera Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k que se aplica a la poblacioacuten completa) sea exactamente igual que la ecuacioacuten estimada a partir observaciones de la muestra Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k Sin embargo podemos utilizarvalor de bi una de las pendientes que calculamos a partir de la muestra para probar hipoacutetesis acca del valor de Bi una de las pendientes del plano de regresioacuten para la poblacioacuten completa

El procedimiento para probar una hipoacutetesis respecto a Bi es parecido al procedimiento analizaen los capiacutetulos 8 y 9 sobre pruebas de hipoacutetesis Para entender este proceso regresemos al probma que relaciona los impuestos no pagados descubiertos con las horas de trabajo en auditoriacuteas campo horas en computadora y recompensas a informantes En la paacutegina 729 sentildealamos que b10597 El primer paso consiste en encontrar un valor para B1 y compararlo con b1 ϭ 0597

Suponga que durante un periodo largo la pendiente de la relacioacuten entre Y y X 1 fue 0400 Paprobar si todaviacutea es vaacutelida podriacuteamos definir las hipoacutetesis como

H0 B1 ϭ 0400 larr Hipoacutetesis nula

H1 B1 0400 larr Hipoacutetesis alternativa

De hecho realizamos la prueba para saber si los datos actuales indican que B1 ha cambiado su vahistoacuterico de 0400

Para encontrar el estadiacutestico de prueba para B1 es necesario hallar primero el error estaacutendar d

coeficiente de regresioacuten El coeficiente de regresioacuten con el que estamos trabajando es b1 de moque el error estaacutendar de este coeficiente se representa con sb1

Resulta demasiado difiacutecil calcular sb1 a mano pero por fortuna Minitab calcula los errores estaacutedar de todos los coeficientes de regresioacuten Por comodidad repetimos la figura 13-2 Los errores taacutendar de los coeficientes se dan en la columna DesvEst de la salida de Minitab

En el cuadro de salida vemos que sb1

es 00811 (Similarmente si deseamos probar una hipoacutesis acerca de B2 vemos que el error estaacutendar apropiado que debemos utilizar es sb2 ϭ 00841) Uvez que encontramos sb1 en la salida de Minitab podemos usar la ecuacioacuten 13-8 para estandarizarpendiente de nuestra ecuacioacuten de regresioacuten ajustada

Estandarizacioacutendel coeficiente deregresioacuten

Error estaacutendar delcoeficientede regresioacuten

Prueba de unahipoacutetesis acerca de B i

Diferencia entre la

ecuacioacuten de regre-sioacuten verdadera y unaestimada a partir delas observacionesde la muestra

Coeficiente de regresioacuten estandarizado

t ϭ [13-8bi ndash Bi0ᎏ

sbi

donde

bull biϭ pendiente de la regresioacuten ajustada

bull Bi0 ϭ pendiente real hipoteacutetica para la poblacioacutenbull sbi ϭ error estaacutendar del coeficiente de regresioacuten

iquestPor queacute utilizamos t para denotar el estadiacutestico estandarizado Recuerde que en la regresioacuten siple utilizamos a y b en la ecuacioacuten 12-7 para calcular se y que se estimaba e la desviacioacuten estaacutedar de las variaciones de los datos (ecuacioacuten 12-13a) Entonces utilizamos se en la ecuacioacuten 12-para encontrar sb el error estaacutendar del coeficiente de regresioacuten que corresponde a la pendiente E

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2056

pezamos con n puntos y los usamos para estimar los dos coeficientes a y b Luego basamtras pruebas en la distribucioacuten t con n Ϫ 2 grados de libertad

De manera similar en la regresioacuten muacuteltiple tambieacuten empezamos con n puntos pero lospara estimar k ϩ 1 coeficientes la ordenada a y k pendientes b1 b2 bk Despueacutes estcientes se usan en la ecuacioacuten 13-6 para calcular se que de nuevo es una estimacioacuten de eviacioacuten estaacutendar de las variaciones de los datos (ecuacioacuten 13-7a) Luego se utiliza se (en ucioacuten que estaacute maacutes allaacute del alcance de este libro) para encontrar s

bi Debido a lo anterior

nuestras pruebas de hipoacutetesis en la distribucioacuten t con n Ϫ k Ϫ 1 (ϭ n Ϫ ( k ϩ l)) grados de En nuestro ejemplo el valor estandarizado del coeficiente de regresioacuten es

t ϭ

ϭ

ϭ 2432 larr Coeficiente de regresioacuten estandarizado

Suponga que estamos interesados en probar nuestras hipoacutetesis al nivel de significancia

Como tenemos 10 observaciones en la muestra y tres variables independientes sabemos n Ϫ k Ϫ 1 o 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad Buscamos en la tabla 2 del apeacutendice en lana de 10 y el rengloacuten de 6 grados de libertad Ahiacute vemos que el valor apropiado de t es 19mo nos preocupa si b1 (la pendiente del plano de regresioacuten de la muestra) es significativamferente de B1 (la pendiente hipoteacutetica del plano de regresioacuten de la poblacioacuten) eacutesta es una pdos colas y los valores criacuteticos son Ϯ1943 El coeficiente de regresioacuten estandarizado es 2se encuentra fuera de la regioacuten de aceptacioacuten de nuestra prueba de hipoacutetesis Por consiguichazamos la hipoacutetesis nula de que B1 todaviacutea es igual a 0400 En otras palabras existe unacia suficientemente grande entre b1 y 0400 para concluir que B1 ha cambiado respecto a histoacuterico Por esto sentimos que cada 100 horas adicionales de trabajo en auditoriacuteas de camaumentan la cantidad de descubrimientos de impuestos no pagados en $400000 como lo hel pasado

Ademaacutes de la prueba de hipoacutetesis podemos construir un intervalo de confianza para cude los valores de Bi Del mismo modo que bi es una estimacioacuten puntual de Bi estos intervalofianza son estimaciones de intervalo de Bi Para ilustrar el proceso de construccioacuten de interconfianza encontremos un intervalo de confianza del 95 para B3 en el ejemplo del IRS Lrelevantes son

b3 ϭ 0405 de la figura 13-2sb3 ϭ 00422

t ϭ 2447 larr Nivel de significancia del 5 y 6 grados de libertad

Intervalo deconfianza para B i

Realizacioacuten de la

prueba de hipoacutetesis

0597 ndash 0400ᎏᎏ

0081

b1 ndash B10ᎏ

sb1

Anaacute l i s i s de r e gr e s i oacutenLa ec uaci oacuten de r egr es i oacuten esDESCUBRE = - 45 0 + 0 597 AUDI TORIacute A + 1 18 COMPUTADORA + 0 405 RECOMPENSA

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 45 796 4 878 - 9 39 0 000AUDI TORIacute A 0 50697 0 08112 7 36 0 000COMPUTADORA 1 17684 0 08407 14 00 0 000RECOMPENSAS 0 40511 0 04223 9 59 0 000

s = 0 2861 R- s q = 98 3

FIGURA 13-2

Salida de Minitab(figura repetida)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2156

Con esta informacioacuten podemos calcular el intervalo de confianza de la siguiente manera

b3 ϩ t (sb3) ϭ 0405 ϩ 2447(00422)

ϭ 0508 larr Liacutemite superior

b3 Ϫ t (sb3) ϭ 0405 Ϫ 2447(00422)

ϭ 0302 larr Liacutemite inferior

Vemos que podemos tener una seguridad del 95 de que cada $1000 adicionales pagados a los formantes aumenta el descubrimiento de impuestos no pagados en una cantidad entre $302000$508000

A menudo estaremos interesados en preguntas del tipo iquesten realidad Y depende de X i Por ejeplo podriacuteamos preguntar si descubrir impuestos no pagados en realidad depende de las horas encomputadora Con frecuencia esta pregunta se plantea como iquestes X i una variable explicativa sigficativa de Y Si piensa un poco maacutes se convenceraacute de que si Bi 0 Y depende de las X i (esto esvariacutea cuando X i variacutea) y no depende de X i si Bi ϭ 0

Vemos que nuestra pregunta conduce a establecer hipoacutetesis de la forma

H0 Bi ϭ 0 larr Hipoacutetesis nula X i no es una variable explicativa significativa

H1 Bi 0 larr Hipoacutetesis alternativa X i es una variable explicativa significativa

Podemos probar estas hipoacutetesis utilizando la ecuacioacuten 13-8 del mismo modo que cuando probamnuestras hipoacutetesis acerca de si B1 todaviacutea era igual a 0400 Sin embargo existe una forma maacutes faacutede hacerlo usando la columna de la figura 13-2 de ldquocociente- t rdquo Observemos de nuevo la ecuaci13-8

t ϭ [13-

Como nuestro valor hipoteacutetico de Bi es cero el valor estandarizado del coeficiente de regresioacutedenotado por t o se convierte en

t o ϭ

El valor de t o se conoce como valor t ldquocalculadordquo Eacuteste es el nuacutemero que aparece en la columna equetada como ldquocociente-t rdquo en la figura 13-2 Denotemos por t c el valor t ldquocriacuteticordquo que buscamos

la tabla 2 del apeacutendice Entonces como la prueba para determinar si X i es una variable explicatisignificativa es una prueba de dos colas soacutelo necesitamos verificar si Ϫt c Յ t o Յ t c

Uso de valores t

calculados en lasalida de Minitab

biᎏ

sbi

bi ndash Bi0ᎏ

sbi

iquestEs significativa unavariable explicativa

Prueba para determinar si una variable es o no significativa

Ϫt c Յ t o Յ t c [13-9

donde

bull t c ϭ valor t adecuado (con n Ϫ k Ϫ 1 grados de libertad) para el nivel de significancia deprueba

bull t o ϭ bi sbi ϭ valor t observado (o calculado) obtenido con el paquete de software

Si t o

cae entre Ϫt c

y t c aceptamos H0 y llegamos a la conclusioacuten de que X

ino es una variable exp

cativa significativa En cualquier otro caso rechazamos H0 y concluimos que X i es una variable eplicativa significativa

Probemos al nivel de significancia de 001 si las horas en computadora constituyen una variabexplicativa significativa para los impuestos no pagados descubiertos De la tabla 2 del apeacutendice cn Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad y ϭ 001 vemos que t c ϭ 3707 De la figura 13tenemos que t o = 1400 Como t o Ͼ t c concluimos que el tiempo en computadora es una variab

Prueba de lasignificancia de lavariable horas decomputadora en elproblema del IRS

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2256

explicativa significativa De hecho al observar los valores t calculados para las otras dos vindependientes (tiempo de auditoriacuteas de campo t o ϭ 736 y recompensa a informantes t ovemos que tambieacuten son variables explicativas significativas

Podemos tambieacuten utilizar la columna de ldquoprdquo para probar si X i es una variable explicativacativa De hecho utilizando esa informacioacuten ni siquiera necesitamos usar la tabla 2 del aLos elementos de esta columna son los valores prob para las hipoacutetesis

H0 Biϭ 0

H1 Bi 0

Recuerde del anaacutelisis hecho en el capiacutetulo 9 que estos valores prob constituyen la probabque cada bi esteacute tan lejos de cero como (o maacutes) el valor observado obtenido de la regresioacutenverdadera Como se ilustra en la figura 13-3 solamente necesitamos comparar estos valocon el nivel de significancia de la prueba para determinar si X i es o no una variable expsignificativa para Y

Probar la significancia de una variable explicativa es siempre una prueba de dos colas Lble independiente X i es una variable explicativa significativa si bi es significativamente dife

cero es decir si t o es un nuacutemero grande positivo o negativoPara el ejemplo del IRS repetimos las pruebas con ϭ 001 Para cada una de las tres v

independientes p es menor que 001 de forma que podemos concluir que cada una de ellanificativa

Inferencias acerca de la regresioacuten como un todo

(usando una prueba F )

Suponga que cubre con papel un tablero para dardos y lanza varios dardos sobre eacutel Despueacuteberlo hecho tendraacute algo muy parecido a un diagrama de dispersioacuten Suponga entonces quuna recta de regresioacuten a este conjunto de ldquopuntos observadosrdquo y calcula r

2 Debido a que lofueron lanzados aleatoriamente usted espera obtener un valor bajo de r

2 puesto que en esten realidad no explica a Y Sin embargo si hace esto muchas veces ocasionalmente observalor alto de r

2 por pura casualidadDada cualquier regresioacuten simple (o muacuteltiple) es natural preguntarse si el valor de r2 (

realmente indica que las variables independientes explican a Y o si esto sucede por cas

A menudo esta interrogante se plantea de la siguiente manera iquestla regresioacuten como un todo ficativa En la uacuteltima seccioacuten vimos coacutemo decidir si una X i individual es una variable exp

Significancia de laregresioacuten comoun todo

FIGURA 13-3

Uso de ldquoprdquo paradeterminar si X i esuna variable expli-cativa significativa

Regioacuten de aceptacioacuten Regioacuten de aceptacioacuten

2 del aacuterea

2 del aacuterea

2 del aacuterea

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

ndasht c

ndasht o

t o

t c

0

(a) p es mayor que X

i no es una variable

explicativa significativa

(b) p es menor que X

i es una variable

explicativa significativa

ndasht o

ndasht c

t c

0

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2356

significativa ahora veremos coacutemo decidir si todas las X i tomadas en conjunto explican significavamente la variabilidad observada de Y Nuestras hipoacutetesis son

H0 B1 ϭ B2 ϭ ϭ Bk ϭ 0 larr Hipoacutetesis nula Y no depende de las X i

H1 por lo menos una Bi 0 larr Hipoacutetesis alternativa Y depende de al menos una de las X i

Cuando analizamos r 2 en el capiacutetulo 12 consideramos la variacioacuten total en Y sum(Y Ϫ Y ෆ )2 la p

te de dicha variacioacuten que explica la regresioacuten sum(Y ˆ Ϫ Y ෆ )2 y la parte no explicada de la variacioacutensum(Y Ϫ Y ˆ )2 La figura 13-4 es un duplicado de la figura 12-15 Sirve como repaso de la relacioacuten etre la desviacioacuten total la desviacioacuten explicada y la desviacioacuten no explicada para un solo dato en uregresioacuten simple Aunque no podamos dibujar una figura similar para una regresioacuten muacuteltiple coceptualmente estamos haciendo lo mismo

Al analizar la variacioacuten en Y fijamos nuestra atencioacuten en tres teacuterminos diferentes cada uno de cuales es una suma de cuadrados Los denotamos con

Suma de cuadradosy sus grados delibertad

Anaacutelisis de lavariacioacuten de losvalores Y

FIGURA 13-4

Desviacioacuten totaldesviacioacutenexplicada ydesviacioacuten noexplicada paraun valor observadode Y

Y

X

Un valor observado de lavariable dependiente (Y )

R e c t a d

e r e g r e s

i oacute n

Desviacioacuten no explicada de esta Y respectoa su media Y

(Y ndash Y )^

Desviacioacuten explicada deesta Y respecto a su media Y

(Y ndash Y )^Y

Valor estimado de esta Y

a partir de la recta de regresioacuten (Y )^

Desviacioacuten total de esta Y

respecto a su media Y

(Y ndash Y )

Tres sumas de cuadrados

SCT ϭ suma de cuadrados total (es decir la parte explicada) ϭ sum(Y Ϫ Y ෆ )2

SCR ϭ suma de cuadrados de la regresioacuten (es decir la parte explicada) ϭ sum(Y ˆ Ϫ Y ෆ )2 [13-10

SCE ϭ suma de cuadrados del error (es decir la parte no explicada) ϭ sum(Y Ϫ Y ˆ )2

Estaacuten relacionadas por la ecuacioacuten

que dice que la variacioacuten total en Y puede dividirse en dos partes la parte explicada y la no explicaCada una de estas sumas de cuadrados tiene un nuacutemero asociado de grados de libertad SCT t

ne n Ϫ 1 grados de libertad (n observaciones menos un grado de libertad debido a que la media la muestra estaacute fija) SCR tiene k grados de libertad porque existen k variables independientes qse utilizaron para explicar Y Finalmente SCE tiene n Ϫ k Ϫ 1 grados de libertad porque utilizamnuestras n observaciones para estimar k ϩ 1 constantes a b1 b2 bk Si la hipoacutetesis nula es ci

ta el cociente

Descomposicioacuten de la variacioacuten total de Y

SCT ϭ SCR ϩ SCE [13-1

Cociente F

F ϭ [13-12SCR k ᎏᎏ

SCE(n ndash k ndash 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2456

tiene una distribucioacuten F con k grados de libertad en el numerador y n Ϫ k Ϫ 1 grados de libel denominador Si la hipoacutetesis nula es falsa entonces el cociente tiende a ser maacutes grande qula hipoacutetesis nula es verdadera De modo que si el cociente F es demasiado grande (seguacuten lo na el nivel de significancia de la prueba y el valor apropiado de la tabla 6 del apeacutendice) rechH0 y concluimos que la regresioacuten como un todo es significativa

La figura 13-5 presenta la salida de Minitab para el problema del IRS Esta parte del rincluye los cocientes F calculados para la regresioacuten en ocasiones llamado anaacutelisis de v

(ANOVA) para la regresioacuten Probablemente se pregunte si esto tiene algo que ver con el anaacutelisrianza que estudiamos en el capiacutetulo 11 La respuesta es siacute Aunque no lo hicimos es posibletrar que el anaacutelisis de varianza visto en el capiacutetulo 11 tambieacuten contempla la variacioacuten total las observaciones alrededor de la gran media y la divide en dos partes una explicada por lascias entre los distintos grupos (que corresponde a lo que llamamos varianza entre columnas)

no explicada por dichas diferencias (que corresponde a la varianza dentro de columnas) Estcisamente anaacutelogo a lo que acabamos de hacer en la ecuacioacuten 13-11Para el problema del IRS vemos que SCR ϭ 29109 (con k ϭ 3 grados de libertad) SCE

(con n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad) y que

F ϭ ϭ ϭ 11833

Los elementos en la columna ldquoMCrdquo son justo las sumas de cuadrados divididas entre sus glibertad Para 3 grados de libertad en el numerador y 6 en el denominador la tabla 6 del apeacutence que 978 es el liacutemite superior de la regioacuten de aceptacioacuten para un nivel de significancia El valor calculado de F 11833 estaacute muy por arriba de 978 de manera que se ve que la r

como un todo es altamente significativa Se puede llegar a la misma conclusioacuten si se observresultado del programa dice que ldquo prdquo es 0000 Debido a que este valor prob es menor que elsignificancia ϭ 001 se concluye que la regresioacuten completa es significativa De esta mapuede usar la p de ANOVA como prueba sin tener que utilizar la tabla 6 del apeacutendice para bvalor criacutetico de F Esto es anaacutelogo a la manera en que se usaron los valores de p en la figura ra probar la significancia de las variables explicativas individuales

Multicolinealidad en la regresioacuten muacuteltiple

En el anaacutelisis de regresioacuten muacuteltiple los coeficientes de regresioacuten a menudo se vuelven

confiables conforme aumenta el grado de correlacioacuten entre las variables independie

existe un alto nivel de correlacioacuten entre algunas de las variables independientes nos enfrenun problema que los estadiacutesticos llaman multicolinealidad

La multicolinealidad puede presentarse si deseamos estimar la recuperacioacuten de las ventaempresa y utilizamos tanto el nuacutemero de vendedores empleados como sus salarios totales Cvalores asociados con estas dos variables independientes tienen una correlacioacuten alta neceusar soacutelo un conjunto de ellos para realizar nuestra estimacioacuten De hecho al agregar una segriable que estaacute correlacionada con la primera se distorsionan los valores de los coeficientgresioacuten Sin embargo a menudo podemos predecir bien Y incluso cuando haya multicoline

Consideremos un ejemplo donde existe multicolinealidad para ver coacutemo afecta a la regresrante los 12 meses pasados el gerente del restaurante Pizza Shack ha estado poniendo unaanuncios en el perioacutedico local Los anuncios se programan y pagan el mes anterior a que ap

Un ejemplo demulticolinealidad

Definicioacuten y efecto dela multicolinealidad

9703ᎏ

0082

29109 3ᎏ

0491 6Prueba de lasignificancia de laregresioacuten en elproblema del Serviciode Contribuciones

Anaacutelisis devarianza parala regresioacuten

Prueba F de laregresioacuten como

un todo

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 29 1088 9 7029 118 52 0Er r or 6 0 4912 0 0819Tot al 9 29 6000

FIGURA 13-5Salida de Minitabanaacutelisis devarianza

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2556

Cada anuncio contiene un cupoacuten que permite llevarse dos pizzas pagando solamente la de mcio El gerente recolectoacute los datos de la tabla 13-4 y le gustariacutea utilizarlos para predecir las vpizzas

En las figuras 13-6 y 13-7 se dieron los resultados de Minitab para las regresiones respelas ventas totales sobre el nuacutemero de anuncios y sobre el costo

Para la regresioacuten sobre el nuacutemero de anuncios tenemos que el valor t observado es 395grados de libertad y un nivel de significancia de ϭ 001 se encontroacute que el valor t criacuteticdo de la tabla 2 del apeacutendice) es 3169 Como t o Ͼ t c (o de manera equivalente como p es m001) concluimos que el nuacutemero de anuncios es una variable explicativa altamente signifilas ventas totales Note tambieacuten que r 2 ϭ 610 de modo que el nuacutemero de anuncios explximadamente el 61 de la variacioacuten en las ventas de pizzas

Para la regresioacuten sobre el costo de los anuncios el valor t observado es 454 de modo qude los anuncios es una variable explicativa de las ventas totales todaviacutea maacutes significativa que ro de anuncios (para los que el valor t observado fue soacutelo 395) En esta regresioacuten r 2 ϭ 673

el costo de los anuncios explica aproximadamente el 67 de la variacioacuten de las ventas de pizComo ambas variables explicativas son altamente significativas por siacute mismas intentam

zar ambas en una regresioacuten muacuteltiple El resultado se presenta en la figura 13-8La regresioacuten muacuteltiple es altamente significativa como un todo ya que la p de ANOVA e

Uso de ambas varia-bles explicativas enuna regresioacuten muacuteltiple

Dos regresionessimples

Datos de ventas y anun-cios para el restaurantePizza Shack

Tabla 13-4 X 1 X 2 Y

Nuacutemero Costo de anuncios Venta tode anuncios publicados de pizz

Mes publicados (cientos de doacutelares) (miles de d

Mayo 12 139 436

Junio 11 120 380

Julio 9 93 301

Agosto 7 97 353

Septiembre 12 123 464

Octubre 8 114 342

Noviembre 6 93 302

Diciembre 13 143 407

Enero 8 102 385

Febrero 6 84 226

Marzo 8 112 376

Abril 10 111 352

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esVENTAS = 16 9 + 2 08 ANUNCI OS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 16 937 4 982 3 40 0 007ANUNCI OS 2 0832 0 5271 3 95 0 003

s = 4 206 R- s q = 61 0

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 1 276 31 276 31 15 62 Er r or 10 176 88 17 69Tot a l 11 453 19

Figura 13-6

Regresioacuten de lasventas sobre elnuacutemero deanuncios conMinitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2656

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2756

gar el nuacutemero de anuncios como segunda variable explicativa ademaacutes del costo de los anuncios eplica nada maacutes alrededor del 1 adicional de la variacioacuten de las ventas totales

En este punto es justo preguntarse iquestqueacute variable realmente explica la variacioacuten de las ventotales en la regresioacuten muacuteltiple La respuesta es que ambas la explican pero no podemos separ

sus contribuciones individuales debido a que estaacuten altamente correlacionadas entre siacute E

consecuencia sus coeficientes en la regresioacuten muacuteltiple tienen errores estaacutendar altos valore

calculados relativamente bajos y valores prob Ͼ | t | relativamente altos

iquestDe queacute manera nos afecta esta multicolinealidad Todaviacutea podemos hacer predicciones relativmente precisas cuando se encuentra presente note que para la regresioacuten muacuteltiple (la salida se dala figura 13-8) el error estaacutendar de la estimacioacuten que determina el ancho de los intervalos de co

fianza para las predicciones es 3989 mientras que para la regresioacuten simple con el costo de los anucios como variable explicativa (salida en la figura 13-7) tenemos se ϭ 3849 Lo que no podemhacer es predecir con mucha precisioacuten coacutemo cambiaraacuten las ventas si aumentamos en uno el nuacutemede anuncios La regresioacuten muacuteltiple dice que b1 ϭ 0625 (esto es cada anuncio aumenta las ventotales de pizzas alrededor de $625) pero el error estaacutendar de este coeficiente es 112 (es decir apximadamente $1120)

Las contribucionesindividuales nopueden separarse

Ejercicios 134

Ejercicios de autoevaluacioacuten

EA 13-4 Edith Pratt es una ocupada ejecutiva de una compantildeiacutea de transporte de carga a nivel nacional y va tara una junta porque no encuentra la salida de la regresioacuten muacuteltiple elaborada por un asistente Si la regsioacuten total es significativa al nivel 005 ella desea usar las salida de computadora como evidencia para fudamentar algunas ideas que expondraacute en la reunioacuten Sin embargo su ayudante estaacute enfermo De hectoda la informacioacuten que tiene de la regresioacuten muacuteltiple es un trozo de papel con los siguientes datos

Regresioacuten paraEdith Pratt

SCR 8724 con gl

SCE con 17 gl

SCT 10236 con 24 gl

Como el papel ni siquiera tiene todos los nuacutemeros Edith ha concluido que no es uacutetil Usted sin embardebe saber maacutes que ella iquestPuede Edith entrar en la junta o debe seguir buscando la salida de computador

EA 13-5 Una pequentildea liacutenea aeacuterea de Nueva Inglaterra realizoacute una encuesta sobre sus 15 terminales y obtuvo losguientes datos para el mes de febrero donde

VENTAS ϭ ingreso total seguacuten el nuacutemero de boletos vendidos (en miles de doacutelares)

PROMOCϭ cantidad gastada en promociones de la liacutenea aeacuterea en el aacuterea (en miles de doacutelares)

COMPET ϭ nuacutemero de liacuteneas aeacutereas que compiten en esa terminal

GRATIS ϭ nuacutemero de pasajeros que vuelan gratis (por diferentes razones)

Sugerencia el concepto de hacer infe-rencias respecto a una regresioacuten muacutelti-ple es justo lo mismo que se hizo en elcapiacutetulo 12 cuando hicimos inferencias

respecto a una recta de regresioacuten excepto que ahora se em-

plean dos o maacutes variables independientes Advertencia lamulticolinealidad es un problema que debe manejarse enla regresioacuten muacuteltiple y es necesario desarrollar una com-prensioacuten con sentido comuacuten Recuerde que todaviacutea puedehacer predicciones precisas cuando estaacute presente Pero re-cuerde tambieacuten que no puede decir con mucha precisioacuten

cuaacutento cambiaraacute la variable dependiente si ldquomanipulardquo lavariables independientes Entonces el objetivo debe seminimizar la multicolinealidad Sugerencia la mejor regresioacuten muacuteltiple es la que explica la relacioacuten entre los datos asentildealar la responsabilidad de la mayor proporcioacuten de la va

riacioacuten en la variable dependiente con el menor nuacutemero dvariables independientes Advertencia no es una buenidea incluir demasiadas variables independientes soacutelo porque cuenta con una computadora y un paquete de softwarpara estadiacutestica

SUGERENCIAS

Y

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2856

Ventas (doacutelares) Promoc (doacutelares) Compet Gratis

793 25 10 3

2001 55 8 6

1632 60 12 9

2001 79 7 16

1460 52 8 15

1777 76 12 9

309 20 12 8

2919 90 5 10

1600 40 8 43394 96 5 16

1596 55 11 7

863 30 12 6

2375 60 6 10

1072 50 10 4

1550 35 10 4

a) Utilice la siguiente salida de Minitab para determinar la ecuacioacuten de regresioacuten que mejor se ara la liacutenea aeacuterea

La ec uaci oacuten de r egr es i oacuten esVENTAS ϭ 172 ϩ 25 9 PROMOVϪ 13 2 COMPET Ϫ 3 04 GRATI S

Pr onos t i cador Coef Des vEs t Coci ent e - t Cons t ant e 172 34 51 38 3 35 0PROMOV 25 950 4 877 5 32 0COMPET - 13 238 3 686 - 3 59 0GRATI S - 3 041 2 342 - 1 30 0

b) iquestLos pasajeros que vuelan gratis ocasionan una disminucioacuten significativa en las ventas Fpruebe las hipoacutetesis apropiadas Use ϭ 005

c) iquestUn incremento de $1000 en las promociones cambia las ventas en $28000 o el cambio ecativamente diferente de $28000 Formule y pruebe las hipoacutetesis adecuadas Use ϭ 010

d) Calcule un intervalo de confianza del 90 para el coeficiente de la pendiente de la COMPET

Aplicaciones

13-22 Mark Lowtown publica el perioacutedico Mosquito Junction Enquirer y tiene problemas para predectidad de papel perioacutedico que necesita imprimir diariamente Eligioacute aleatoriamente 27 diacuteas del arior y registroacute la siguiente informacioacuten

PESO ϭ peso en libras de papel perioacutedico para la edicioacuten de ese diacutea

CLASIFICADOS ϭ nuacutemero de anuncios clasificados

PUBLICIDAD ϭ nuacutemero de anuncios publicitarios

PLANA COMPLETA ϭ nuacutemero de anuncios a una plana

Utilizando Minitab para hacer una regresioacuten de PESO sobre las otras tres variables Mark obtuguiente salida

Pr onos t i cador Coef Des vEs t Coci ent e- t Cons t ant e 1072 95 872 43 1 23 0CLASI FI CADOS 0 251 0 126 1 99 0PUBLI CI DAD 1 250 0 884 1 41 0PLANA COMPLETA 250 66 67 92 3 69 0

a) Mark siempre ha pensado que cada anuncio publicitario utiliza al menos 3 libras de papel iquestsioacuten le da una razoacuten significativa para dudar esto al nivel del 5

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2956

b) De manera similar Mark siempre ha creiacutedo que cada anuncio clasificado utiliza aproximmedia libra de papel iquestTiene ahora Mark una razoacuten significativa para dudar esto al nivel del

c) Mark vende espacios de anuncios de plana completa a los comerciantes locales a $30 la paacutegberaacute pensar en ajustar sus tarifas si el papel perioacutedico le cuesta $009 por libra Suponga costos son despreciables Establezca expliacutecitamente las hipoacutetesis y una conclusioacuten (Sugere

jando todo lo demaacutes constante cada anuncio adicional de plana completa tiene un costo de bras de papel ϫ $009 por libra ϭ $2256 El punto de equilibrio es 333333 libras iquestPor quel coeficiente de pendiente para PLANA COMPLETA es significativamente mayor que Mark no estaacute obteniendo ganancias y debe cambiar sus tarifas)

13-23 Para los datos del ejercicio 13-18 y un nivel de significancia de 010 iquestcuaacuteles variables son sign

mente explicativas de los resultados de los exaacutemenes (Habiacutea 12 estudiantes en la muestra) 13-24 Para los datos del ejercicio 13-18 y la siguiente salida de Minitab del procedimiento de regresiple hecho por Bill

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 3134 42 783 60Er r or 7 951 25 135 89Tot a l 11 4085 67

a) iquestCuaacutel es el valor observado de F b) A un nivel de significancia de 005 iquestcuaacutel es el valor criacutetico de F que se debe utilizar para d

si la regresioacuten como un todo es significativac) Basaacutendose en las respuestas a los incisos a) y b) iquestes la regresioacuten significativa como un tod

13-25 Remiacutetase al ejercicio 13-19 A un nivel de significancia de 001 iquestes la variable DISTANCIA uble explicativa significativa para VENTAS

13-26 Para los datos del ejercicio 13-19 y la siguiente salida adicional de Minitab al correr la regresioacuten

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 2861495 715374 102 39 0Er r or 18 125761 6896 7Tot a l 22 2987256

Al nivel de significancia de 005 iquestes la regresioacuten significativa como un todo

13-27 Henry Lander es el director de produccioacuten de la Alecos Corporation de Caracas Venezuela Hede que le ayude a determinar una foacutermula para predecir el ausentismo de los empacadores de chipoacutetesis es que la temperatura diaria promedio puede explicar el porcentaje de ausentismo Durios meses reuacutene datos ejecuta el procedimiento de regresioacuten simple y encuentra que la tempeplica 66 de la variacioacuten en el ausentismo Pero Henry no estaacute convencido de que eacuteste sea un cador satisfactorio Sugiere que la precipitacioacuten pluvial diaria podriacutea tambieacuten tener algo que vausentismo de modo que registra los datos correspondientes y hace una regresioacuten del ausentismte el tiempo de lluvias y obtiene un valor R2 de 059 ldquoiexclEurekardquo grita usted ldquoiexclLo tengo Con uticador que explica 66 y otro que explica 59 todo lo que tengo que hacer es una regresioacutenutilizando ambos y seguramente tendreacute un pronosticador casi perfectordquo Para su desaacutenimo sin la regresioacuten muacuteltiple tiene una R

2 de soacutelo 68 que es solamente un poco mejor que la variablperatura sola iquestCoacutemo puede explicar esta aparente discrepancia

13-28 Juan Armenlegg administrador de Rockyrsquos Diamond y Jewelry Store estaacute interesado en desamodelo para estimar la demanda del consumidor para su costosa mercanciacutea Como la mayoriacutea de

tes compran diamantes y joyas a creacutedito Juan estaacute seguro de que dos factores que deben influirmanda de los clientes son la tasa real de inflacioacuten anual y la tasa real de intereses sobre preacutestamprincipales bancos del paiacutes Explique algunos problemas que Juan podriacutea encontrar si fuera a dun modelo de regresioacuten basado en estas dos variables de prediccioacuten

13-29 Un nuevo programa de juegos Check That Model pide a los concursantes que especifiquen el nuacutenimo de paraacutemetros que necesitan para determinar si un modelo de regresioacuten muacuteltiple es signifimo un todo para ϭ 001 Usted ganoacute la apuesta con 4 paraacutemetros Use la siguiente informacioacutenterminar si la regresioacuten es significativa

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3056

R 2

ϭ 07452

SCE ϭ 1254

n ϭ 18

Nuacutemero de variables independientes ϭ 3

13-30 La Scottish Turist Agency estaacute interesada en el nuacutemero de turistas que entran al paiacutes cada semanrante la temporada alta Se recolectaron los siguientes datos

Turistas (Y ) ϭ nuacutemero de turistas que entran a Escocia en una semana (en miles)

Cambio (X 1)ϭ nuacutemero de libras escocesas compradas por $1 doacutelar

Precio (X 2) ϭ nuacutemero de libras escocesas cobradas por viaje redondo en camioacuten de Londres a Edimburgo

Promoc (X 3) ϭ cantidad gastada en promocioacuten del paiacutes (en miles de libras escocesas)Temp (X 4) ϭ temperatura media durante la semana en Edimburgo (en grados Celsius)

Turistas (Y ) Cambio (X 1) Precio (X 2) Promoc (X 3) Temp (X 4)

69 061 40 87 154

71 059 40 88 156

68 063 40 85 154

79 061 35 86 153

76 060 35 94 158

82 065 35 99 162

80 058 35 98 164

84 059 35 102 166

97 061 30 114 174

98 062 30 116 172

72 057 40 84 176

67 055 40 86 164

a) Utilice el paquete de software que tenga para determinar la ecuacioacuten de regresioacuten que mejote a los datos de la agencia de turismo

b) iquestEs la tasa de cambio una variable explicativa significativa Establezca y pruebe las hipoacutetesidas a un nivel de significancia de 010

c) Un incremento de 1000 libras en las promociones iquestaumenta el nuacutemero de turistas en maacutesEstablezca y pruebe las hipoacutetesis adecuadas para un nivel de significancia de 005

d) Calcule un intervalo de confianza del 95 para el coeficiente de la pendiente de Temp

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-4 Como SCT ϭ SCR ϩ SCE SCE ϭ SCT Ϫ SCR ϭ 10236 Ϫ 8724 ϭ 1512Como gl SCT ϭ gl SCR ϩ gl SCE gl SCR ϭ gl SCT Ϫ gl SCE ϭ 24 Ϫ 17 ϭ 7

Entonces F ϭ ϭ ϭ 1401

F CRiacuteT ϭ F (7 17 005) ϭ 261Como F OBS gt F CRIacuteT se concluye que la regresioacuten es significativa como un todo Edith debe conticando la salida de computadora de la regresioacuten para usarla en la junta

EA 13-5 De la salida de computadora se obti enen los siguientes resultadosa) VENTAS ϭ 17234 ϩ 25950PROMOC Ϫ13238COMPET Ϫ 3041GRATISb) H0 BGRATIS ϭ 0 H1 BGRATIS Ͻ 0 ϭ 005

Eacutesta es una prueba de una cola y el valor prob en los resultados es para la alternativa de dos c BGRATIS 0 De manera que para esta prueba el valor prob es 02212 ϭ 0111 Ͼ ϭ 00que no se puede rechazar H0 las ventas no disminuyen significativamente cuando aumenta ro de pasajeros que vuelan gratis

c) H0 BPROMOC ϭ 28 H1 BPROMOC 28 ϭ 010

87247ᎏᎏ

151217SCRk ᎏᎏ

SCE(n Ϫ k Ϫ 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3156

El valor observado t de los resultados de regresioacuten es

ϭ ϭ Ϫ0420

Con 11 grados de libertad y ϭ 010 en ambas colas combinadas los valores criacuteticos t parba son Ϯ1796 asiacute el valor observado estaacute dentro de la regioacuten de aceptacioacuten No se rechacambio en VENTAS para un incremento de una unidad ($1000) en PROMOC no es significate diferente de 28 ($28000)

d) Con 11 grados de libertad el valor t para un intervalo del 90 de confianza es 1796 por lo

tervalo esbCOMP Ϯ 1796sbCOMP

ϭ Ϫ13238 Ϯ 1796(3686)

ϭ Ϫ13238 Ϯ 6620 ϭ (Ϫ19858 Ϫ 6618)

La liacutenea aeacuterea puede tener una seguridad del 90 de que el ingreso por los boletos en una ofminuye entre $6600 y $19900 aproximadamente con cada liacutenea aeacuterea adicional que comp

135 Teacutecnicas de modelado

Dada una variable que deseamos explicar y un conjunto de variables explicativas potencialehaya varias ecuaciones de regresioacuten diferentes que podamos estudiar dependiendo de queacute explicativas incluyamos y de coacutemo lo hagamos Cada una de esas ecuaciones de regresioacutence como modelo Las teacutecnicas de modelado son las distintas formas en que podemos incluriables explicativas y verificar queacute tan apropiados son los modelos de regresioacuten Existen municas de modelado diferentes pero soacutelo veremos dos de las maacutes utilizadas

Datos cualitativos y variables ficticias

En todos los ejemplos de regresioacuten que hemos visto hasta ahora los datos manejados hanmeacutericos o cuantitativos Pero ocasionalmente nos enfrentaremos con una variable categoacuterilitativa En el problema del inicio el capiacutetulo el director de personal desea ver si el salarioun vendedor depende de su sexo En la tabla 13-5 repetimos los datos de dicho problema

Por el momento ignore la antiguumledad y utilice la teacutecnica desarrollada en el capiacutetulo 9 bar la diferencia entre las medias de dos poblaciones para ver si los hombres ganan maacutes qu

jeres Pruebe con ϭ 001 Si tomamos a los hombres como la poblacioacuten 1 y a las mujerespoblacioacuten 2 probaremos las siguientes hipoacutetesis

H0 1 ϭ 2 larr Hipoacutetesis nula no existe discriminacioacuten por sexo en los salarios base

H1 1 Ͼ 2 larr Hipoacutetesis alternativa se discrimina a las mujeres en su salario base

ϭ 001 larr Nivel de significancia

Revisioacuten del enfoqueanterior del problema

Buacutesqueda dediferentes modelos

25950 Ϫ 28ᎏᎏ

4877

(bPROMOC Ϫ 28)ᎏᎏ

sbPROMOC

Datos para el problemade discriminacioacuten porsexo

Tabla 13-5 Vendedores VendedorasAntiguumledad Salario base Antiguumledad Salario base(en meses) (en miles) (en meses) (en miles)

6 75 5 62

10 86 13 87

12 91 15 94

18 103 21 98

30 130

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3256

A continuacioacuten bosquejamos el anaacutelisis Si tiene problemas para seguirlo deberaacute repasamente la seccioacuten 93

n1 ϭ 5 n2 ϭ 4

x ෆ1 ϭ 97 x ෆ2 ϭ 8525

s2

1 ϭ 4415 s2

2 ϭ 2609

s2

p ϭ

ϭ

ϭ 3641

x ෆ1Ϫ x

ෆ2ϭ s pΊ ϩ

ϭ 128

t ϭ

ϭ

ϭ 092

Con siete grados de libertad el valor t criacutetico para una prueba de cola superior con ϭ 001 eComo el valor t observado de 092 es menor que 2998 no podemos rechazar H0

Entonces el anaacutelisis concluye que no parece haber discriminacioacuten por sexo en los salarPero recuerde que hasta ahora se han ignorado los datos de antiguumledad laboral para el anaacuteli

Antes de seguir vea el diagrama de dispersioacuten de los datos En la figura 13-9 los punto

corresponden a los hombres y los blancos a las mujeres El diagrama de dispersioacuten muestraridad que el salario base aumenta con los antildeos de antiguumledad pero si con la mirada sigue lo qla recta de regresioacuten notaraacute que los puntos negros tienden a estar arriba de ella y los blancos

La figura 13-10 da la salida de una regresioacuten del salario base sobre los meses de antiguumlelos resultados se ve que la antiguumledad es una variable explicativa altamente significativa

Ademaacutes r 2

ϭ 926 que indica que la variable meses de antiguumledad explica cerca del 9variacioacuten en el salario base La figura 13-11 contiene parte de la salida que no se vio antesbla de residuos Para cada punto el residuo es simplemente Y Ϫ Y ˆ que se reconoce como el

Una ldquomiradardquo a los

datos

El enfoque anterior nodetecta discriminacioacuten

(97 ndash 8525) ndash 0ᎏᎏ

128

( x ෆ1 ndash x ෆ2) ndash (1 Ϫ 2)H0

ᎏᎏᎏ

ˆ x ෆ1Ϫ

x ෆ2

1ᎏ

n2

1ᎏ

n1

4(4415) ϩ 3(2609)ᎏᎏᎏ5 ϩ 4 ndash 2

(n1 ndash 1)s21 ϩ (n2 ndash 1)s22ᎏᎏᎏ

n1 ϩ n2 ndash 2

FIGURA 13-9

Diagrama de dis-persioacuten de salariosbase contra mesesde antiguumledad

4 8 12 16 20 24 28

4

8

12

Meses de antiguumledad

S a l a r i o ( m i l e s d e d oacute l a r e s )

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3356

el ajuste de la recta de regresioacuten en ese punto En la figura 13-11 AJUST1 son los valores y RESI1 son los residuos

Tal vez la parte maacutes importante del anaacutelisis del resultado de una regresioacuten sea estusiduos Si la regresioacuten incluye todos los factores explicativos relevantes estos residuo

ser aleatorios Dicho de otro modo si los residuos muestran cualquier patroacuten no aleat

to indica que hay algo sistemaacutetico que afecta el proceso y que no hemos tomado en cu

manera que buscamos patrones en los residuos o para decirlo de forma maacutes pintoresca ldquopmos a los residuos hasta hacerlos hablarrdquo

Si observamos los residuos presentados en la figura 13-11 vemos que los primeros cincoson positivos De modo que para los vendedores tenemos Y ndash Y ˆ Ͼ 0 o Y Ͼ Y ˆ es decir laregresioacuten cae abajo de estos cinco puntos Tres de los cuatro uacuteltimos residuos son negaticonsiguiente para las vendedoras tenemos Y Ϫ Y ˆ Ͻ 0 o Y Ͻ Y ˆ asiacute que la recta de regresicuentra arriba de tres de los cuatro puntos Esto confirma lo que vimos al observar el diagdispersioacuten de la figura 13-9 Este patroacuten no aleatorio en los residuos sugiere que el sexo siacute etor determinante del salario base

iquestCoacutemo podemos incorporar el sexo de los vendedores dentro del modelo de regresioacutencemos utilizando un dispositivo llamado variable ficticia (o variable indicadora) Para lpuntos que representan a los vendedores esta variable tiene valor de 0 y para los cuatro purepresentan a las vendedoras valdraacute 1 Los datos de entrada para nuestra regresioacuten con variticias se dan en la tabla 13-6

Para los datos de la tabla 13-6 se ajusta una regresioacuten de la forma

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

Uso de variablesficticias

Deteccioacuten depatrones en losresiduos

ldquoPresionar a losresiduosrdquo

Anaacutel i s i s de r e gr e s i oacuten

La ec uac i oacuten de r e gr es i oacuten esSALARI O ϭ 5 81 ϩ 0 233 MESES

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t pCons t a nt e 5 8093 0 4038 14 39 0 000MESES 0 23320 0 02492 9 36 0 000

s ϭ 0 5494 R- s q ϭ 92 6

Anaacute l i s i s de va r i a nz aFUENTE GL SC MC F Re gr e s i oacuten 1 26 443 24 443 87 61 0Er r or 7 2 113 0 302Tot a l 8 28 556

FIGURA 13-10

Regresioacuten conMinitab del salariobase sobre losmeses deantiguumledad

RENGLOacuteN SALARI O AJ UST1 RESI 1

1 7 5 7 2085 0 2914992 8 6 8 1413 0 458684

3 9 1 8 6077 0 4922764 10 3 10 0069 0 2930545 13 0 12 8054 0 1946076 6 2 6 9753 - 0 7752977 8 7 8 8409 - 0 1409288 9 4 9 3073 0 0926649 9 8 10 7066 - 0 906558

FIGURA 13-11

Tabla de residuosde Minitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 956

(Y ) X 2

Precio X 1 Millas(miles de doacutelares) Antildeo (miles)

299 1987 556

602 1992 184

887 1993 213

392 1988 469

955 1994 118

905 1991 364

937 1992 282

42 1988 44248 1989 349

574 1991 264

13-13 La Reserva Federal de Estados Unidos realiza un estudio preliminar para determinar la relacioacuten etos indicadores econoacutemicos y el cambio porcentual anual en el producto interno bruto (PIB) Dindicadores examinados son el monto del deacuteficit del gobierno federal (en miles de millones de del promedio industrial Dow Jones (el valor medio del antildeo) Los datos correspondientes a seis antilde

Y X 1 X 2

Cambio en el PIB Deacuteficit federal Dow Jones

25 100 2850

Ϫ10 400 2100

40 120 330010 200 2400

15 180 2550

30 80 2700

a) Encuentre (calcule) la ecuacioacuten de miacutenimos cuadrados que mejor describa los datosb) iquestQueacute porcentaje de cambio en el PIB se esperariacutea en un antildeo en el cual el deacuteficit federal fue

millones de doacutelares y el promedio Dow Jones fue 3000

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-1 a) Y X 1 X 2 X 1Y X 2Y X 1X 2 X 2

1 X 2

2

25 35 50 875 1250 175 1225 2500

30 67 42 2010 1260 2814 4489 1764

11 15 85 165 935 1275 225 7225

22 03 14 66 308 042 009 196

27 46 36 1242 972 1656 2116 1296

19 20 13 380 247 260 400 169

1 ෆ3 ෆ4 ෆ 1 ෆ8 ෆ ෆ6 ෆ 2 ෆ4 ෆ ෆ0 ෆ 4 ෆ7 ෆ3 ෆ ෆ8 ෆ 4 ෆ9 ෆ7 ෆ ෆ2 ෆ 7 ෆ7 ෆ ෆ9 ෆ7 ෆ 8 ෆ4 ෆ ෆ6 ෆ4 ෆ 1 ෆ3 ෆ1 ෆ ෆ5 ෆ0 ෆ

Las ecuaciones 13-2 13-3 y 13-4 se convierten en

Y ϭ na ϩ b1 X 1 ϩ b2 X 2 134 ϭ 6 a ϩ 186b1 ϩ 240 b2

X 1Y ϭ a X 1 ϩ b1 X 21 ϩb2 X 1 X 2 4738 ϭ 186a ϩ 8464b1 ϩ 7797b2

X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22 4972 ϭ 240a ϩ 7797b1 ϩ 13150b2

Al resolver estas ecuaciones de manera simultaacutenea se obtiene

a ϭ 203916 b1 ϭ 23403 b2 ϭ Ϫ13283

De modo que la ecuacioacuten de regresioacuten es Y ˆ ϭ 203916 ϩ 23403 X 1 Ϫ 13283 X 2b) Con X 1 ϭ 30 y X 2 ϭ 27

Y ˆ = 203916 ϩ 23403(30) Ϫ 13283(27) ϭ 2883

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1056

EA 13-2 a) En este problema Y ϭ renta X 1 ϭ nuacutemero de habitaciones X 2 ϭ distancia al centro

Y X 1 X 2 X 1Y X 2Y X 1X 2 X 2

1 X 2

2 Y 2

360 2 1 720 360 2 4 1 129600

1000 6 1 600 1000 6 36 1 1000000

450 3 2 1350 900 6 9 4 202500

525 4 3 2100 1575 12 16 9 272625

350 2 10 700 3500 20 4 100 122500

300 1 4 300 1200 4 1 16 90000

2985 18 21 11170 8535 50 70 131 1820225

Las ecuaciones 13-2 13-3 y 13-4 se convierten en

Y ϭ na ϩ b1 X 1 ϩb2 X 2 2985 ϭ 6a ϩ 18b1 ϩ 21b2

X 1Y ϭ a X 1 ϩ b1 X 21 ϩb2 X 1 X 2 11170 ϭ 18a ϩ 70b1 ϩ 50b2

X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22 8535 ϭ 21a ϩ 50b1 ϩ 131b2

Al resolver estas ecuaciones simultaacuteneas se obtiene

a ϭ 964581 b1 ϭ 1364847 b2 ϭ Ϫ24035

De manera que la ecuacioacuten de regresioacuten es

Y ˆ ϭ 964581 ϩ 1364847 X 1 Ϫ 24035 X 2

b) Cuando el nuacutemero de habitaciones ϭ 2 y la distancia al centro ϭ 2

Y ˆ ϭ 964581 ϩ 1364847(2) Ϫ 24035(2) ϭ $365

133 La computadora y la regresioacutenmuacuteltiple

En el capiacutetulo 12 y hasta donde vamos de eacuteste hemos presentado problemas simplificados y muestrasde tamantildeo pequentildeo Despueacutes del ejemplo de la seccioacuten anterior probablemente usted haya llegadoa la conclusioacuten de que no estaacute interesado en la regresioacuten si tiene que hacer los caacutelculos a mano Dehecho conforme aumenta el tamantildeo de las muestras y crece el nuacutemero de variables independientespara la regresioacuten hacer los caacutelculos incluso con la ayuda de una calculadora de bolsillo se convier-te en algo muy inconveniente

Sin embargo como administradores debemos manejar problemas complejos que requieren mues-tras maacutes grandes y variables independientes adicionales Como ayuda para resolver estos problemasmaacutes detallados utilizaremos una computadora que nos permitiraacute realizar un gran nuacutemero de caacutelcu-los en poco tiempo

Suponga que tenemos no una ni dos variables independientes sino un nuacutemero k de ellas X 1

X 2 X k Como antes sea n el nuacutemero de datos que se tienen La ecuacioacuten de regresioacuten que inten-tamos estimar es

Inconvenienciadel caacutelculo deregresiones a mano

Ecuacioacuten de estimacioacuten de regresioacuten muacuteltiple

Y ˆ ϭ

b1 X 1ϩ

b2 X 2ϩ ϩ

bk X k [13-5]

Ahora veremos coacutemo podemos utilizar una computadora para estimar los coeficientes de regresioacutenPara demostrar coacutemo una computadora maneja el anaacutelisis de regresioacuten muacuteltiple tomemos el pro-

blema del Servicio Interno de Contribuciones (IRS) de la seccioacuten anterior Suponga que el departa-mento de auditoriacuteas agrega a su modelo la informacioacuten correspondiente a las recompensas para losinformantes La dependencia desea incluir esta tercera variable independiente X 3 debido a que sien-

Demostracioacuten de laregresioacuten muacuteltipleen la computadora

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1156

te que existe cierta relacioacuten entre estas recompensas y el descubrimiento de impuestos no pEn la tabla 13-3 se registroacute la informacioacuten de los uacuteltimos 10 meses

Para resolver este problema la divisioacuten de auditoriacutea usoacute el procedimiento de regresioacutende Minitab Por supuesto todaviacutea no sabemos coacutemo interpretar la solucioacuten que proporciocomo veremos la mayor parte de los nuacutemeros dados en la solucioacuten corresponden muy de c

los estudiados en el contexto de regresioacuten simple

Salida de Minitab

Una vez que se introducen los datos y se eligen las variables dependiente e independientescalcula los coeficientes de regresioacuten y varios estadiacutesticos asociados con la ecuacioacuten de regrveraacute la salida del programa para el problema del IRS La figura 13-2 da la primera parte de la

1 La ecuacioacuten de regresioacuten De los nuacutemeros dados en la columna Coef se puede leercioacuten de estimacioacuten

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ b3 X 3

ϭ Ϫ45796 ϩ 0597 X 1 ϩ 1177 X 2 ϩ 0405 X 3

Podemos interpretar esta ecuacioacuten en una forma similar a la de la ecuacioacuten de regresioacutevariables en la paacutegina 558 Si se mantienen constantes el nuacutemero de horas de audicampo X 1 y el nuacutemero de horas de computadora X 2 y se cambian las recompeninformantes X 3 entonces el valor de Y ˆ aumentaraacute $405000 por cada $1000 pagadosformantes De igual manera al mantener X 1 y X 3 constantes se ve que por cada 1adicionales de tiempo de computadora Y ˆ aumentaraacute $1177000 Por uacuteltimo si se dej

Buacutesqueda e interpre-tacioacuten de la ecuacioacutende regresioacuten

Salida del programaMinitab

Uso de Minitab pararesolver problemasde regresioacuten muacuteltiple

Factores relacionadoscon el descubrimientode impuestos nopagados

Tabla 13-3 Horas en Impueauditoriacuteas Horas Recompensa pagde campo en computadora a informantes descub(cientos) (cientos) (miles) (mill

Mes X 1 X 2 X 3

Enero 45 16 71 2

Febrero 42 14 70 2

Marzo 44 15 72 2

Abril 45 13 71 2

Mayo 43 13 75 2

Junio 46 14 74 2

Julio 44 16 76 3

Agosto 45 16 69 2

Septiembre 44 15 74 2

Octubre 43 15 73 2

FIGURA 13-2

Salida de Minitabpara la regresioacuten

del ServicioInterno deContribuciones

Anaacutel i s i s de r e gr e s i oacuten

La ec ua ci oacuten de r egr es i oacuten es

DESCUBRE ϭ mdash45 0 ϩ 0 597 AUDI T ϩ 1 18 COMPUTADORA ϩ 0 405 RECOMPENS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e Ϫ45 796 4 878 Ϫ9 39 0 000AUDI T 0 50697 0 08112 7 36 0 000COMPUTADORA 1 17684 0 08407 14 00 0 000RECOMPENSA 0 40511 0 04223 9 59 0 000

s ϭ 0 2861 R- s q ϭ 98 3

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1256

tantes X 2 y X 3 se estima que 100 horas adicionales dedicadas a auditoriacuteas de campo descubri-raacuten $597000 adicionales de impuestos no pagados Observe que se redondearon los valoresproporcionados por la regresioacuten dada por Minitab (figura 13-2)

Suponga que en noviembre el IRS intenta dejar las horas de trabajo en auditoriacuteas de cam-po y las horas en computadora en sus niveles de octubre (4300 y 1500) pero decide aumen-tar las recompensas pagadas a los informantes a $75000 iquestCuaacutento de impuestos no pagadosesperan descubrir en noviembre Sustituyendo estos valores en la ecuacioacuten de regresioacuten esti-mada obtenemos

Y ˆ ϭ Ϫ45796 ϩ 0597 X 1 ϩ 1177 X 2 ϩ 0405 X 3

Y ˆ ϭ Ϫ45796 ϩ 0597(43) ϩ 1177(15) ϩ 0405(75)

Y ˆ ϭ Ϫ45796 ϩ 25671 ϩ 17655 ϩ 30375

Y ˆ ϭ 27905 larr Descubrimientos estimados $27905000

De modo que el departamento de auditoriacuteas espera descubrir aproximadamente $28 millonesde evasioacuten de impuestos en noviembre

2 Una medida de dispersioacuten el error estaacutendar de la estimacioacuten de la regresioacuten muacuteltiple Ya quehemos determinado la ecuacioacuten que relaciona a nuestras tres variables necesitamos una me-dida de la dispersioacuten alrededor de este plano de regresioacuten muacuteltiple En la regresioacuten simple laestimacioacuten es maacutes precisa conforme el grado de dispersioacuten alrededor de la regresioacuten es menorLo mismo es cierto para los puntos de la muestra que se encuentran alrededor del plano de re-gresioacuten muacuteltiple Para medir esta variacioacuten debemos utilizar de nuevo la medida conocida co-

mo error estaacutendar de la estimacioacuten

Medicioacuten de ladispersioacuten alrededordel plano de regre-sioacuten muacuteltiple usodel error estaacutendar dela estimacioacuten

Error estaacutendar de la estimacioacuten

se ϭ Ί [13-6]Y ndash Y ˆ )2ᎏᎏ

n Ϫ k Ϫ 1

donde

bull Y ϭ valores muestrales de la variable dependientebull Y ˆ ϭ valores correspondientes estimados con la ecuacioacuten de regresioacutenbull n ϭ nuacutemero de puntos de la muestrabull k ϭ nuacutemero de variables independientes (ϭ 3 en nuestro ejemplo)

El denominador de esta ecuacioacuten indica que en la regresioacuten muacuteltiple con k variables in-

dependientes el error estaacutendar tiene n Ϫ k Ϫ 1 grados de libertad Esto se debe a que los

grados de libertad se reducen de n en k ϩ 1 constantes numeacutericas a b1 b2 hellip b k que se

estimaron a partir de la misma muestra

Para calcular se observamos los errores individuales (Y Ϫ Y ˆ ) en el plano de regresioacuten ajus-tado los elevamos al cuadrado calculamos su media (dividiendo entre n Ϫ k Ϫ 1 en lugar den) y tomamos la raiacutez cuadrada del resultado Debido a la forma en que se calcula se se cono-ce a veces como raiacutez del error cuadraacutetico medio [o raiacutez de mse (mean-square error)] De lasalida de Minitab que usa s en lugar de se para denotar el error estaacutendar vemos que la raiacutez demse en el problema del Servicio Interno de Contribuciones es 0286 es decir $286000

Como en el caso de la regresioacuten simple podemos utilizar el error estaacutendar de la estimacioacuteny la distribucioacuten t para formar un intervalo de confianza alrededor de nuestro valor estimadoY ˆ En el problema de la evasioacuten de impuestospara 4300 horas de trabajo en auditoriacuteas de cam-po 1500 horas en computadora y $75000 de pago a informantes Y ˆ es $27905000 como es-timacioacuten de impuestos no pagados descubiertos y se es $286000 Si deseamos construir unintervalo de confianza del 95 alrededor de esta estimacioacuten de $27905000 miramos enla tabla 2 del apeacutendice en la columna del 5 y localizamos ahiacute el rengloacuten correspondiente a

Intervalos deconfianza para Y ˆ

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1356

n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad El valor apropiado de t para nuestracioacuten del intervalo es de 2447 En consecuencia podemos calcular los liacutemites de nutervalo de confianza como sigue

Y ˆ ϩ t (se) ϭ 27905000 ϩ (2447)(286000)

Y ˆ ϩ t(se) ϭ 27905000 ϩ 699800

Y ˆ ϩ t(se) ϭ 28604800 larr Liacutemite superior

Y ˆ Ϫ t (se) ϭ 27905000 Ϫ (2447)(286000)

Y ˆ ϩ t(se) ϭ 27905000 ndash 699800

Y ˆ ϩ t(se) ϭ 27205200 larr Liacutemite inferior

Con un nivel de confianza del 95 el departamento de auditoriacuteas puede sentirse sque los descubrimientos reales estaraacuten en este intervalo que va de $27205200 a $28Si el IRS desea usar un nivel de confianza menor como 90 puede reducir el intevalores para la estimacioacuten de descubrimientos de impuestos no pagados Igual que cgresioacuten simple podemos utilizar la distribucioacuten normal estaacutendar (tabla 1 del apeacutendaproximar la distribucioacuten t siempre que los grados de libertad (n menos el nuacutemero cientes de regresioacuten estimados) sea un nuacutemero mayor que 30

Al antildeadir la tercera variable independiente (recompensas a informantes) iquestmejoroacuteregresioacuten Como se mide la dispersioacuten de los datos alrededor del plano de regresioacutenmenores de se deberiacutean indicar mejores regresiones Para la regresioacuten de dos variablecimos con anterioridad en este mismo capiacutetulo se resultoacute ser 1076 Como al agregarra variable se se redujo a 0286 vemos que siacute mejoroacute el ajuste de la regresioacuten en este Sin embargo en general no es cierto que al agregar variables siempre se reduzc

3 El coeficiente de determinacioacuten muacuteltiple Al estudiar el anaacutelisis de correlacioacuten simpmos la fuerza de la relacioacuten entre dos variables utilizando el coeficiente de determinla muestra r 2 Este coeficiente de determinacioacuten es la fraccioacuten de la variacioacuten total riable dependiente Y que se explica con la ecuacioacuten de estimacioacuten

Similarmente en la correlacioacuten muacuteltiple mediremos la fuerza de la relacioacuten entre trbles utilizando el coeficiente de determinacioacuten muacuteltiple R

2 o su raiacutez cuadrada R (el cte de correlacioacuten muacuteltiple) Este coeficiente de determinacioacuten muacuteltiple es tambieacuten la

que representa la porcioacuten de la variacioacuten total de Y que ldquoexplicardquo el plano de regr

Note que la salida del programa da el valor 983 para R2 Esto nos dice que las tr

bles independientes explican el 983 de la variacioacuten total de impuestos no pagadobiertos Para la regresioacuten de dos variables hecha antes R2 es soacutelo 0729 asiacute que las trabajo en auditoriacutea de campo y las horas en computadora explican el 729 de la vaagregar las recompensas a los informantes explica el 254 restante de la variacioacuten

Todaviacutea no hemos explicado los nuacutemeros en las columnas etiquetadas con Desvciente t y p de la figura 13-2 Estos nuacutemeros se utilizaraacuten para hacer inferencias acercano de regresioacuten de la poblacioacuten tema que se trataraacute en la seccioacuten 13-4

Uso del coeficientede determinacioacutenmuacuteltiple

Valor de variablesadicionales

Interpretacioacuten delintervalo deconfianza

Ya nadie calcula regresiones a mano hayotras cosas maacutes interesantes en queacute ocu-par nuestro tiempo Se explicoacute la teacutecnicacalculando las soluciones a mano para

que no tenga que pensar en su computadora como en unaldquocaja negrardquo que hace muchas cosas uacutetiles que no puedeexplicar Sugerencia el valor real de usar la computadorapara calcular regresiones muacuteltiples es que puede manejarmuchas variables independientes y obtener una mejor ecua-

cioacuten de estimacioacuten que puede medir si agregar otrble independiente realmente mejora los resultados yposible observar con rapidez el comportamiento de

indica la proporcioacuten de la variacioacuten total de la variapendiente que se explica con las variables indepenLa computadora hace todo el trabajo tedioso mdashsin semdash y le deja tiempo para el trabajo maacutes importcomprender los resultados y usarlos para tomar mdecisiones

SUGERENCIASY

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1456

La ec uac i oacuten de r egr es i oacuten esY = - 12 75 + 17 1 X1 + 0 54 1 X2 - 0 17 4 X3

Pr onos t i c ador Coe f De s vEs t Coc i e nt e - t pCons t a n t e - 1275 2699 - 0 47 0 719X1 17 059 6 908 2 47 0 245X2 0 5406 0 3144 1 72 0 335X3 - 0 1743 0 1005 - 1 73 0 333

s = 396 1 R- s q = 87 2

b) iquestQueacute porcentaje de la variacioacuten total del nuacutemero de solicitudes urgentes de devolucioacuten de impuestosexplica esta ecuacioacuten

c) Para este antildeo el iacutendice econoacutemico es 169 la poblacioacuten residente en un radio de una milla desde la

oficina es 10212 habitantes y el ingreso promedio en Ithaca es $26925 iquestCuaacutentas solicitudes urgen-tes de devolucioacuten de impuestos debe Pam esperar procesar entre el 1 de marzo y el 15 de abril

Conceptos baacutesicos 13-14 Dado el siguiente conjunto de datos utilice el paquete de software que tenga disponible para encontrar la

ecuacioacuten de regresioacuten de mejor ajuste y responda a lo siguientea) iquestCuaacutel es la ecuacioacuten de regresioacutenb) iquestCuaacutel es el error estaacutendar de la estimacioacutenc) iquestCuaacutel es el valor de R

2 para esta regresioacutend) iquestCuaacutel es el valor pronosticado para Y cuando X 1 ϭ 58 X 2 ϭ 42 y X 3 ϭ 51

Y X 1 X 2 X 3

647 35 53 85809 74 16 26246 25 63 45439 37 94 88777 55 14 36206 83 92 25669 67 25 27343 12 22 13

Ejercicios 133

Ejercicios de autoevaluacioacuten

EA 13-3 Pam Schneider posee y opera un despacho de contadores en Ithaca Nueva York Ella piensa que seriacutea uacutetilpredecir el nuacutemero de solicitudes urgentes de devolucioacuten de impuestos que le pediraacuten durante el ajetrea-do periodo del 1 de marzo al 15 de abril para poder planear mejor sus necesidades de personal duranteesta eacutepoca Tiene la hipoacutetesis de que varios factores pueden ser uacutetiles para su pronoacutestico Los datos de es-tos factores y el nuacutemero de solicitudes urgentes de devolucioacuten de impuestos de antildeos pasados son

Y X 2 Nuacutemero de

Poblacioacuten solicitudesresidente X 3 de devolucioacuten

X 1 en un radio Ingreso urgentesIacutendice de una milla promedio (1 de marzo

econoacutemico desde la oficina en Ithaca a 15 de abril)

99 10188 21465 2306106 8566 22228 1266100 10557 27665 1422129 10219 25200 1721179 9662 26300 2544

a) Use el siguiente resultado de Minitab para determinar la ecuacioacuten de regresioacuten maacutes adecuada para es-

tos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1556

13-15 Dado el siguiente conjunto de datos utilice el paquete de software que tenga a su disposicioacuten patrar la ecuacioacuten de regresioacuten de mejor ajuste y responda a lo siguientea) iquestCuaacutel es la ecuacioacuten de regresioacutenb) iquestCuaacutel es el error estaacutendar de la estimacioacutenc) iquestCuaacutel es el valor de R2 para esta regresioacutend) Deacute un intervalo de confianza para la estimacioacuten del 95 para el valor Y cuando los valores X

y X 4 son 524 416 358 y 3 respectivamente

X 1 X 2 X 3 X 4 Y

214 629 219 Ϫ2 228

517 407 429 5 937418 818 698 2 649

118 410 909 Ϫ4 192

716 226 129 8 558

919 615 309 1 231

Aplicaciones

1316 Las estaciones de policiacutea en Estados Unidos estaacuten interesadas en predecir el nuacutemero de arrestodos que deberaacuten procesar cada mes para programar mejor a los empleados de oficina En los daricos el nuacutemero promedio de arrestos (Y ) cada mes tiene influencia del nuacutemero de oficiales en

policiaca ( X 1) la poblacioacuten de la ciudad en miles ( X 2) y el porcentaje de personas desempleadasdad en miles ( X 3) Los datos de estos factores en 15 ciudades se presentan en la tablaa) Utilice el paquete de software que tenga disponible para determinar la ecuacioacuten de regresioacuten

jor se ajuste a estos datosb) iquestQueacute porcentaje de la variacioacuten total en el nuacutemero de arrestos (Y ) explica esta ecuacioacutenc) El departamento de policiacutea de ChapelBoro desea pronosticar el nuacutemero de arrestos mensua

pelBoro tiene una poblacioacuten de 75000 habitantes 82 elementos en su fuerza policiaca y utaje de desempleo del 105 iquestCuaacutentos arrestos pronostica para cada mes

Nuacutemero promedio Nuacutemero de oficiales Tamantildeo de la ciudad (X 2) Porcende arrestos mensuales (Y ) en la fuerza (X 1) en miles de habitantes desemp

3906 68 816 4

5043 94 751 3

6284 125 973 5

7456 175 1235 8

5852 113 1184 11

4503 82 654 9

3278 46 616 12

2605 32 543 18

4775 89 974 4

3898 67 824 6

3124 47 564 8

3675 59 713 7

3744 61 674 9

4946 87 963 11

4875 92 864 4

13-17 Estamos intentando predecir la demanda anual (DEMAND) de cierto producto utilizando las svariables independientes

PRECIO ϭ precio del producto (en doacutelares)

INGRESO ϭ ingreso del consumidor (en doacutelares)

SUB ϭ precio de un bien sustituto (en doacutelares)

( Nota Un bien sustituto es aquel que puede suplir a otro bien Por ejemplo la margarina es untituto de la mantequilla)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1656

Se recolectaron datos correspondientes al periodo 1982-1996

Antildeo Demanda Precio ($) Ingreso ($) Sub ($)

1982 40 9 400 101983 45 8 500 141984 50 9 600 121985 55 8 700 131986 60 7 800 111987 70 6 900 151988 65 6 1000 161989 65 8 1100 17

1990 75 5 1200 221991 75 5 1300 191992 80 5 1400 201993 100 3 1500 231994 90 4 1600 181995 95 3 1700 241996 85 4 1800 21

a) Utilice el paquete de software que tenga disponible para encontrar la ecuacioacuten de regresioacuten ajuste para estos datos

b) iquestSon los signos (ϩ o Ϫ) de los coeficientes de regresioacuten de las variables independientes los qperan Deacute una explicacioacuten breve ( Nota Eacutesta no es una pregunta estadiacutestica soacutelo necesita pesignifican los coeficientes de regresioacuten)

c) Establezca e interprete el coeficiente de determinacioacuten muacuteltiple del problemad) Establezca e interprete el error estaacutendar de la estimacioacuten para el problemae) Seguacuten la ecuacioacuten de regresioacuten obtenida iquestqueacute valor de DEMAND predeciriacutea si el precio de

ductos fue $6 el ingreso del consumidor $1200 y el precio del bien sustituto $17 13-18 Bill Buxton profesor de estadiacutestica de una prominente escuela de administracioacuten tiene un prof

tereacutes en los factores que afectan el desempentildeo de los estudiantes en los exaacutemenes El examen psemestre anterior tuvo una distribucioacuten de calificaciones amplia pero Bill tiene la certeza de qfactores explican esa distribucioacuten permite a sus estudiantes que estudien en tantos libros comoca el coeficiente de inteligencia de los estudiantes variacutea tienen distintas edades y difieren losque dedican a estudiar Con el propoacutesito de desarrollar una foacutermula de prediccioacuten para las califde los exaacutemenes Bill pidioacute a cada estudiante que respondiera al final del examen preguntas refe

tiempo de estudio y nuacutemero de libros utilizados Los registros que teniacutea Bill ya incluiacutean el coefiinteligencia y la edad de modo que reunioacute los datos del grupo y corrioacute la regresioacuten muacuteltiple deLa salida de la corrida de Bill fue la siguiente

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t Con s t a nt e minus49 948 41 55 minus1 20 0HORAS 1 06931 0 98163 1 09 0CI 1 36460 0 37627 3 63 0LI BROS 2 03982 1 50799 1 35 0EDAD minus1 79890 0 67332 minus2 67 0

s = 11 657 R- s q = 76 7

a) iquestCuaacutel es la ecuacioacuten de regresioacuten de mejor ajuste para estos datos

b) iquestQueacute porcentaje de la variacioacuten en las calificaciones se explica con esta ecuacioacutenc) iquestQueacute calificacioacuten esperariacutea usted para un estudiante de 21 antildeos de edad con un coeficiente gencia (CI) de 113 que estudioacute durante cinco horas y utilizoacute tres libros diferentes

13-19 La compantildeiacutea de tiendas de abarrotes Twenty-Two estaacute planeando expandir su cadena Como ayudleccionar los lugares donde abriraacute las nuevas tiendas recolectoacute datos de las ventas semanales de casus 23 tiendas Para explicar la variabilidad de las ventas semanales tambieacuten reunioacute informacioacutencribe cuatro variables que se cree estaacuten relacionadas con las ventas Las variables se definen como

VENTAS ϭ ventas semanales promedio en cada tienda en miles de doacutelares

AUTOS ϭ volumen promedio de traacutensito de automoacuteviles por semana en miles de autos

ENTRADA ϭ facilidad de entradasalida medida en una escala de 1 a 100

INGANUAL ϭ ingreso anual promedio por familia en el aacuterea en miles de doacutelares

DISTANCIA ϭ distancia en millas desde la tienda al supermercado maacutes cercano

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1756

Los datos se analizaron con Minitab y la salida es la siguiente

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t Cons t a nt e 175 37 92 62 1 89 0 0AUTOS - 0 028 0 315 minus0 09 0 9ENTRADA 3 775 1 272 2 97 0 0I NGANUAL 1 990 4 510 0 44 0 6DI STANCI A 212 41 28 090 7 56 0 0

s = 85 587 R- s q = 95 8

a) iquestCuaacutel es la ecuacioacuten de regresioacuten de mejor ajuste dada por Minitab

b) iquestCuaacutel es el error estaacutendar de la estimacioacuten para esta ecuacioacutenc) iquestQueacute fraccioacuten de la variacioacuten en las ventas se explica con esta regresioacutend) iquestQueacute ventas predeciriacutea para una tienda localizada en un vecindario que tuvo un ingreso anu

milia de $20000 estaba a 2 millas del supermercado maacutes cercano se encontraba en una calvolumen promedio semanal de traacutensito de 100000 autos y con una facilidad de entrada de

13-20 Rick Blackburn estaacute pensando en vender su casa Con el fin de decidir el precio que pediraacute poreunido datos de 12 ventas recientes Registroacute el precio de venta (en miles de doacutelares) el nuacutemercuadrados de construccioacuten (en cientos de pies cuadrados) el nuacutemero de pisos el nuacutemero de bantiguumledad de la casa (en antildeos)

Precio de venta Pies cuad Pisos Bantildeos Antiguumledad

4965 89 1 10 2

6795 95 1 10 68115 126 2 15 11

8160 129 2 15 8

9150 190 2 10 22

9525 176 1 10 17

10035 200 2 15 12

10425 206 2 15 11

11265 205 1 20 9

14970 251 2 20 8

16065 227 2 20 18

23250 408 3 40 12

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de

de mejor ajuste para los datosb) iquestCuaacutel es el valor de R2 para esta ecuacioacutenc) Si la casa de Rick tiene 1800 pies cuadrados (ϭ 180 cientos de pies cuadrados) un piso

y seis antildeos de antiguumledad iquestqueacute precio de venta puede esperar Rick 13-21 La Allegheny Steel Corporation ha estado buscando los factores que influyen en la cantidad de

millones de toneladas) que puede vender cada antildeo La administracioacuten sospecha que los siguientfactores principales la tasa anual de inflacioacuten del paiacutes el precio promedio por tonelada del acetado que acota los precios (en doacutelares) de Allegheny y el nuacutemero de automoacuteviles (en millonesfabricantes de autos de Estados Unidos planean producir ese antildeo Se recolectaron los datos de losiete antildeos

Y X 2 X 3

Millones X 1 Cota de Nuacutemero

de tons Tasa de importa- deAntildeo vendidas inflacioacuten ciones automoacuteviles

1993 42 31 310 62

1992 31 39 500 51

1991 40 75 220 57

1990 47 107 450 71

1989 43 155 435 65

1988 37 130 260 61

1987 35 110 305 59

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1856

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de regresioacutende mejor ajuste para los datos

b) iquestQueacute porcentaje de la variacioacuten total de la cantidad de acero vendido (en millones de toneladas) porAllegheny cada antildeo explica esta ecuacioacuten

c) iquestCuaacutentas toneladas de acero deberaacute esperar Allegheny vender en un antildeo en el que la tasa de inflacioacutenes 71 los fabricantes de automoacuteviles norteamericanos planean producir 60 millones de autos y la co-ta promedio del acero importado por tonelada es $350

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-3 De la salida del paquete de software se obtienen los siguientes resultadosa) Y ˆ ϭ Ϫ1275 ϩ 17059 X 1 ϩ 05406 X 2 Ϫ 01743 X 3b) R

2ϭ 872 el modelo explica el 872 de la variacioacuten total en Y

c) Y ˆ ϭ Ϫ1275 ϩ 17059(169) ϩ 05406(10212) Ϫ 01743(26925) ϭ 2436 reembolsos de impuestos

134 Inferencias sobre paraacutemetrosde poblacioacuten

En el capiacutetulo 12 se vio que la recta de regresioacuten de la muestra Y ˆ ϭ a ϩ bX (ecuacioacuten 12-3) esti-maba la recta de regresioacuten de la poblacioacuten Y ϭ A ϩ BX (ecuacioacuten 12-13) La razoacuten por la cual soacute-lo podiacuteamos estimar la recta de regresioacuten de poblacioacuten y no determinarla con exactitud era que los

puntos no caen exactamente en la recta de regresioacuten de la poblacioacuten Debido a las variaciones alea-torias los puntos satisfaciacutean Y ϭ A ϩ BX ϩ e (ecuacioacuten 12-13a) maacutes que a Y ϭ A ϩ BX

En la regresioacuten muacuteltiple se tiene justo la misma situacioacuten Nuestro plano de regresioacuten estimado

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k [13-5]

es una estimacioacuten de un plano de regresioacuten de poblacioacuten verdadero pero desconocido de la forma

Plano de regresioacutende la poblacioacuten

De nuevo los puntos individuales normalmente no caen con exactitud en el plano de regresioacuten depoblacioacuten Consideremos el problema del Servicio Interno de Contribuciones para ver por queacute Notodos los pagos a informantes tendraacuten la misma efectividad Algunas horas en computadora podriacuteanutilizarse para recolectar y organizar datos otras para analizar esos datos en busca de errores y frau-des El eacutexito de la computadora en descubrir impuestos no pagados puede depender de cuaacutento tiempose dedique a cada una de estas actividades Por eacutestas y otras razones algunos de los puntos se en-contraraacuten arriba del plano de regresioacuten y algunos estaraacuten abajo de eacuteste En lugar de satisfacer laecuacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

los puntos individuales satisfaraacuten la ecuacioacuten

Las variaciones alea-torias desplazan lospuntos del plano deregresioacuten

Ecuacioacuten de regresioacuten de la poblacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

Plano de regresioacuten de la poblacioacuten maacutes la variacioacuten aleatoria

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e [13-7a]

La cantidad e que aparece en la ecuacioacuten 13-7a es una variacioacuten aleatoria que en promedio es iguala cero La desviacioacuten estaacutendar de las variaciones individuales e y el error estaacutendar de la estima-cioacuten se que estudiamos en la seccioacuten anterior es una estimacioacuten de e

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1956

Como nuestro plano de regresioacuten de la muestra Y ˆ ϭ a ϩ b1X1 ϩ b2 X 2 ϩ ϩ bk X k (ecuaci13-7) estima el plano de regresioacuten de poblacioacuten desconocido Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk

(ecuacioacuten 13-7) deberemos ser capaces de usarlo para hacer inferencias sobre el plano de regreside la poblacioacuten En esta seccioacuten haremos inferencias acerca de las pendientes ( B1 B2 Bk ) deecuacioacuten de regresioacuten ldquoverdaderardquo (la que se aplica a la poblacioacuten completa) basadas en las pendietes (b1 b2 bk ) de la ecuacioacuten de regresioacuten estimada a partir de la muestra de datos

Inferencias acerca de una pendiente individual B i El plano de regresioacuten se deriva de una muestra y no de la poblacioacuten completa Como resultado

podemos esperar que la ecuacioacuten de regresioacuten verdadera Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k que se aplica a la poblacioacuten completa) sea exactamente igual que la ecuacioacuten estimada a partir observaciones de la muestra Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k Sin embargo podemos utilizarvalor de bi una de las pendientes que calculamos a partir de la muestra para probar hipoacutetesis acca del valor de Bi una de las pendientes del plano de regresioacuten para la poblacioacuten completa

El procedimiento para probar una hipoacutetesis respecto a Bi es parecido al procedimiento analizaen los capiacutetulos 8 y 9 sobre pruebas de hipoacutetesis Para entender este proceso regresemos al probma que relaciona los impuestos no pagados descubiertos con las horas de trabajo en auditoriacuteas campo horas en computadora y recompensas a informantes En la paacutegina 729 sentildealamos que b10597 El primer paso consiste en encontrar un valor para B1 y compararlo con b1 ϭ 0597

Suponga que durante un periodo largo la pendiente de la relacioacuten entre Y y X 1 fue 0400 Paprobar si todaviacutea es vaacutelida podriacuteamos definir las hipoacutetesis como

H0 B1 ϭ 0400 larr Hipoacutetesis nula

H1 B1 0400 larr Hipoacutetesis alternativa

De hecho realizamos la prueba para saber si los datos actuales indican que B1 ha cambiado su vahistoacuterico de 0400

Para encontrar el estadiacutestico de prueba para B1 es necesario hallar primero el error estaacutendar d

coeficiente de regresioacuten El coeficiente de regresioacuten con el que estamos trabajando es b1 de moque el error estaacutendar de este coeficiente se representa con sb1

Resulta demasiado difiacutecil calcular sb1 a mano pero por fortuna Minitab calcula los errores estaacutedar de todos los coeficientes de regresioacuten Por comodidad repetimos la figura 13-2 Los errores taacutendar de los coeficientes se dan en la columna DesvEst de la salida de Minitab

En el cuadro de salida vemos que sb1

es 00811 (Similarmente si deseamos probar una hipoacutesis acerca de B2 vemos que el error estaacutendar apropiado que debemos utilizar es sb2 ϭ 00841) Uvez que encontramos sb1 en la salida de Minitab podemos usar la ecuacioacuten 13-8 para estandarizarpendiente de nuestra ecuacioacuten de regresioacuten ajustada

Estandarizacioacutendel coeficiente deregresioacuten

Error estaacutendar delcoeficientede regresioacuten

Prueba de unahipoacutetesis acerca de B i

Diferencia entre la

ecuacioacuten de regre-sioacuten verdadera y unaestimada a partir delas observacionesde la muestra

Coeficiente de regresioacuten estandarizado

t ϭ [13-8bi ndash Bi0ᎏ

sbi

donde

bull biϭ pendiente de la regresioacuten ajustada

bull Bi0 ϭ pendiente real hipoteacutetica para la poblacioacutenbull sbi ϭ error estaacutendar del coeficiente de regresioacuten

iquestPor queacute utilizamos t para denotar el estadiacutestico estandarizado Recuerde que en la regresioacuten siple utilizamos a y b en la ecuacioacuten 12-7 para calcular se y que se estimaba e la desviacioacuten estaacutedar de las variaciones de los datos (ecuacioacuten 12-13a) Entonces utilizamos se en la ecuacioacuten 12-para encontrar sb el error estaacutendar del coeficiente de regresioacuten que corresponde a la pendiente E

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2056

pezamos con n puntos y los usamos para estimar los dos coeficientes a y b Luego basamtras pruebas en la distribucioacuten t con n Ϫ 2 grados de libertad

De manera similar en la regresioacuten muacuteltiple tambieacuten empezamos con n puntos pero lospara estimar k ϩ 1 coeficientes la ordenada a y k pendientes b1 b2 bk Despueacutes estcientes se usan en la ecuacioacuten 13-6 para calcular se que de nuevo es una estimacioacuten de eviacioacuten estaacutendar de las variaciones de los datos (ecuacioacuten 13-7a) Luego se utiliza se (en ucioacuten que estaacute maacutes allaacute del alcance de este libro) para encontrar s

bi Debido a lo anterior

nuestras pruebas de hipoacutetesis en la distribucioacuten t con n Ϫ k Ϫ 1 (ϭ n Ϫ ( k ϩ l)) grados de En nuestro ejemplo el valor estandarizado del coeficiente de regresioacuten es

t ϭ

ϭ

ϭ 2432 larr Coeficiente de regresioacuten estandarizado

Suponga que estamos interesados en probar nuestras hipoacutetesis al nivel de significancia

Como tenemos 10 observaciones en la muestra y tres variables independientes sabemos n Ϫ k Ϫ 1 o 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad Buscamos en la tabla 2 del apeacutendice en lana de 10 y el rengloacuten de 6 grados de libertad Ahiacute vemos que el valor apropiado de t es 19mo nos preocupa si b1 (la pendiente del plano de regresioacuten de la muestra) es significativamferente de B1 (la pendiente hipoteacutetica del plano de regresioacuten de la poblacioacuten) eacutesta es una pdos colas y los valores criacuteticos son Ϯ1943 El coeficiente de regresioacuten estandarizado es 2se encuentra fuera de la regioacuten de aceptacioacuten de nuestra prueba de hipoacutetesis Por consiguichazamos la hipoacutetesis nula de que B1 todaviacutea es igual a 0400 En otras palabras existe unacia suficientemente grande entre b1 y 0400 para concluir que B1 ha cambiado respecto a histoacuterico Por esto sentimos que cada 100 horas adicionales de trabajo en auditoriacuteas de camaumentan la cantidad de descubrimientos de impuestos no pagados en $400000 como lo hel pasado

Ademaacutes de la prueba de hipoacutetesis podemos construir un intervalo de confianza para cude los valores de Bi Del mismo modo que bi es una estimacioacuten puntual de Bi estos intervalofianza son estimaciones de intervalo de Bi Para ilustrar el proceso de construccioacuten de interconfianza encontremos un intervalo de confianza del 95 para B3 en el ejemplo del IRS Lrelevantes son

b3 ϭ 0405 de la figura 13-2sb3 ϭ 00422

t ϭ 2447 larr Nivel de significancia del 5 y 6 grados de libertad

Intervalo deconfianza para B i

Realizacioacuten de la

prueba de hipoacutetesis

0597 ndash 0400ᎏᎏ

0081

b1 ndash B10ᎏ

sb1

Anaacute l i s i s de r e gr e s i oacutenLa ec uaci oacuten de r egr es i oacuten esDESCUBRE = - 45 0 + 0 597 AUDI TORIacute A + 1 18 COMPUTADORA + 0 405 RECOMPENSA

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 45 796 4 878 - 9 39 0 000AUDI TORIacute A 0 50697 0 08112 7 36 0 000COMPUTADORA 1 17684 0 08407 14 00 0 000RECOMPENSAS 0 40511 0 04223 9 59 0 000

s = 0 2861 R- s q = 98 3

FIGURA 13-2

Salida de Minitab(figura repetida)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2156

Con esta informacioacuten podemos calcular el intervalo de confianza de la siguiente manera

b3 ϩ t (sb3) ϭ 0405 ϩ 2447(00422)

ϭ 0508 larr Liacutemite superior

b3 Ϫ t (sb3) ϭ 0405 Ϫ 2447(00422)

ϭ 0302 larr Liacutemite inferior

Vemos que podemos tener una seguridad del 95 de que cada $1000 adicionales pagados a los formantes aumenta el descubrimiento de impuestos no pagados en una cantidad entre $302000$508000

A menudo estaremos interesados en preguntas del tipo iquesten realidad Y depende de X i Por ejeplo podriacuteamos preguntar si descubrir impuestos no pagados en realidad depende de las horas encomputadora Con frecuencia esta pregunta se plantea como iquestes X i una variable explicativa sigficativa de Y Si piensa un poco maacutes se convenceraacute de que si Bi 0 Y depende de las X i (esto esvariacutea cuando X i variacutea) y no depende de X i si Bi ϭ 0

Vemos que nuestra pregunta conduce a establecer hipoacutetesis de la forma

H0 Bi ϭ 0 larr Hipoacutetesis nula X i no es una variable explicativa significativa

H1 Bi 0 larr Hipoacutetesis alternativa X i es una variable explicativa significativa

Podemos probar estas hipoacutetesis utilizando la ecuacioacuten 13-8 del mismo modo que cuando probamnuestras hipoacutetesis acerca de si B1 todaviacutea era igual a 0400 Sin embargo existe una forma maacutes faacutede hacerlo usando la columna de la figura 13-2 de ldquocociente- t rdquo Observemos de nuevo la ecuaci13-8

t ϭ [13-

Como nuestro valor hipoteacutetico de Bi es cero el valor estandarizado del coeficiente de regresioacutedenotado por t o se convierte en

t o ϭ

El valor de t o se conoce como valor t ldquocalculadordquo Eacuteste es el nuacutemero que aparece en la columna equetada como ldquocociente-t rdquo en la figura 13-2 Denotemos por t c el valor t ldquocriacuteticordquo que buscamos

la tabla 2 del apeacutendice Entonces como la prueba para determinar si X i es una variable explicatisignificativa es una prueba de dos colas soacutelo necesitamos verificar si Ϫt c Յ t o Յ t c

Uso de valores t

calculados en lasalida de Minitab

biᎏ

sbi

bi ndash Bi0ᎏ

sbi

iquestEs significativa unavariable explicativa

Prueba para determinar si una variable es o no significativa

Ϫt c Յ t o Յ t c [13-9

donde

bull t c ϭ valor t adecuado (con n Ϫ k Ϫ 1 grados de libertad) para el nivel de significancia deprueba

bull t o ϭ bi sbi ϭ valor t observado (o calculado) obtenido con el paquete de software

Si t o

cae entre Ϫt c

y t c aceptamos H0 y llegamos a la conclusioacuten de que X

ino es una variable exp

cativa significativa En cualquier otro caso rechazamos H0 y concluimos que X i es una variable eplicativa significativa

Probemos al nivel de significancia de 001 si las horas en computadora constituyen una variabexplicativa significativa para los impuestos no pagados descubiertos De la tabla 2 del apeacutendice cn Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad y ϭ 001 vemos que t c ϭ 3707 De la figura 13tenemos que t o = 1400 Como t o Ͼ t c concluimos que el tiempo en computadora es una variab

Prueba de lasignificancia de lavariable horas decomputadora en elproblema del IRS

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2256

explicativa significativa De hecho al observar los valores t calculados para las otras dos vindependientes (tiempo de auditoriacuteas de campo t o ϭ 736 y recompensa a informantes t ovemos que tambieacuten son variables explicativas significativas

Podemos tambieacuten utilizar la columna de ldquoprdquo para probar si X i es una variable explicativacativa De hecho utilizando esa informacioacuten ni siquiera necesitamos usar la tabla 2 del aLos elementos de esta columna son los valores prob para las hipoacutetesis

H0 Biϭ 0

H1 Bi 0

Recuerde del anaacutelisis hecho en el capiacutetulo 9 que estos valores prob constituyen la probabque cada bi esteacute tan lejos de cero como (o maacutes) el valor observado obtenido de la regresioacutenverdadera Como se ilustra en la figura 13-3 solamente necesitamos comparar estos valocon el nivel de significancia de la prueba para determinar si X i es o no una variable expsignificativa para Y

Probar la significancia de una variable explicativa es siempre una prueba de dos colas Lble independiente X i es una variable explicativa significativa si bi es significativamente dife

cero es decir si t o es un nuacutemero grande positivo o negativoPara el ejemplo del IRS repetimos las pruebas con ϭ 001 Para cada una de las tres v

independientes p es menor que 001 de forma que podemos concluir que cada una de ellanificativa

Inferencias acerca de la regresioacuten como un todo

(usando una prueba F )

Suponga que cubre con papel un tablero para dardos y lanza varios dardos sobre eacutel Despueacuteberlo hecho tendraacute algo muy parecido a un diagrama de dispersioacuten Suponga entonces quuna recta de regresioacuten a este conjunto de ldquopuntos observadosrdquo y calcula r

2 Debido a que lofueron lanzados aleatoriamente usted espera obtener un valor bajo de r

2 puesto que en esten realidad no explica a Y Sin embargo si hace esto muchas veces ocasionalmente observalor alto de r

2 por pura casualidadDada cualquier regresioacuten simple (o muacuteltiple) es natural preguntarse si el valor de r2 (

realmente indica que las variables independientes explican a Y o si esto sucede por cas

A menudo esta interrogante se plantea de la siguiente manera iquestla regresioacuten como un todo ficativa En la uacuteltima seccioacuten vimos coacutemo decidir si una X i individual es una variable exp

Significancia de laregresioacuten comoun todo

FIGURA 13-3

Uso de ldquoprdquo paradeterminar si X i esuna variable expli-cativa significativa

Regioacuten de aceptacioacuten Regioacuten de aceptacioacuten

2 del aacuterea

2 del aacuterea

2 del aacuterea

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

ndasht c

ndasht o

t o

t c

0

(a) p es mayor que X

i no es una variable

explicativa significativa

(b) p es menor que X

i es una variable

explicativa significativa

ndasht o

ndasht c

t c

0

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2356

significativa ahora veremos coacutemo decidir si todas las X i tomadas en conjunto explican significavamente la variabilidad observada de Y Nuestras hipoacutetesis son

H0 B1 ϭ B2 ϭ ϭ Bk ϭ 0 larr Hipoacutetesis nula Y no depende de las X i

H1 por lo menos una Bi 0 larr Hipoacutetesis alternativa Y depende de al menos una de las X i

Cuando analizamos r 2 en el capiacutetulo 12 consideramos la variacioacuten total en Y sum(Y Ϫ Y ෆ )2 la p

te de dicha variacioacuten que explica la regresioacuten sum(Y ˆ Ϫ Y ෆ )2 y la parte no explicada de la variacioacutensum(Y Ϫ Y ˆ )2 La figura 13-4 es un duplicado de la figura 12-15 Sirve como repaso de la relacioacuten etre la desviacioacuten total la desviacioacuten explicada y la desviacioacuten no explicada para un solo dato en uregresioacuten simple Aunque no podamos dibujar una figura similar para una regresioacuten muacuteltiple coceptualmente estamos haciendo lo mismo

Al analizar la variacioacuten en Y fijamos nuestra atencioacuten en tres teacuterminos diferentes cada uno de cuales es una suma de cuadrados Los denotamos con

Suma de cuadradosy sus grados delibertad

Anaacutelisis de lavariacioacuten de losvalores Y

FIGURA 13-4

Desviacioacuten totaldesviacioacutenexplicada ydesviacioacuten noexplicada paraun valor observadode Y

Y

X

Un valor observado de lavariable dependiente (Y )

R e c t a d

e r e g r e s

i oacute n

Desviacioacuten no explicada de esta Y respectoa su media Y

(Y ndash Y )^

Desviacioacuten explicada deesta Y respecto a su media Y

(Y ndash Y )^Y

Valor estimado de esta Y

a partir de la recta de regresioacuten (Y )^

Desviacioacuten total de esta Y

respecto a su media Y

(Y ndash Y )

Tres sumas de cuadrados

SCT ϭ suma de cuadrados total (es decir la parte explicada) ϭ sum(Y Ϫ Y ෆ )2

SCR ϭ suma de cuadrados de la regresioacuten (es decir la parte explicada) ϭ sum(Y ˆ Ϫ Y ෆ )2 [13-10

SCE ϭ suma de cuadrados del error (es decir la parte no explicada) ϭ sum(Y Ϫ Y ˆ )2

Estaacuten relacionadas por la ecuacioacuten

que dice que la variacioacuten total en Y puede dividirse en dos partes la parte explicada y la no explicaCada una de estas sumas de cuadrados tiene un nuacutemero asociado de grados de libertad SCT t

ne n Ϫ 1 grados de libertad (n observaciones menos un grado de libertad debido a que la media la muestra estaacute fija) SCR tiene k grados de libertad porque existen k variables independientes qse utilizaron para explicar Y Finalmente SCE tiene n Ϫ k Ϫ 1 grados de libertad porque utilizamnuestras n observaciones para estimar k ϩ 1 constantes a b1 b2 bk Si la hipoacutetesis nula es ci

ta el cociente

Descomposicioacuten de la variacioacuten total de Y

SCT ϭ SCR ϩ SCE [13-1

Cociente F

F ϭ [13-12SCR k ᎏᎏ

SCE(n ndash k ndash 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2456

tiene una distribucioacuten F con k grados de libertad en el numerador y n Ϫ k Ϫ 1 grados de libel denominador Si la hipoacutetesis nula es falsa entonces el cociente tiende a ser maacutes grande qula hipoacutetesis nula es verdadera De modo que si el cociente F es demasiado grande (seguacuten lo na el nivel de significancia de la prueba y el valor apropiado de la tabla 6 del apeacutendice) rechH0 y concluimos que la regresioacuten como un todo es significativa

La figura 13-5 presenta la salida de Minitab para el problema del IRS Esta parte del rincluye los cocientes F calculados para la regresioacuten en ocasiones llamado anaacutelisis de v

(ANOVA) para la regresioacuten Probablemente se pregunte si esto tiene algo que ver con el anaacutelisrianza que estudiamos en el capiacutetulo 11 La respuesta es siacute Aunque no lo hicimos es posibletrar que el anaacutelisis de varianza visto en el capiacutetulo 11 tambieacuten contempla la variacioacuten total las observaciones alrededor de la gran media y la divide en dos partes una explicada por lascias entre los distintos grupos (que corresponde a lo que llamamos varianza entre columnas)

no explicada por dichas diferencias (que corresponde a la varianza dentro de columnas) Estcisamente anaacutelogo a lo que acabamos de hacer en la ecuacioacuten 13-11Para el problema del IRS vemos que SCR ϭ 29109 (con k ϭ 3 grados de libertad) SCE

(con n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad) y que

F ϭ ϭ ϭ 11833

Los elementos en la columna ldquoMCrdquo son justo las sumas de cuadrados divididas entre sus glibertad Para 3 grados de libertad en el numerador y 6 en el denominador la tabla 6 del apeacutence que 978 es el liacutemite superior de la regioacuten de aceptacioacuten para un nivel de significancia El valor calculado de F 11833 estaacute muy por arriba de 978 de manera que se ve que la r

como un todo es altamente significativa Se puede llegar a la misma conclusioacuten si se observresultado del programa dice que ldquo prdquo es 0000 Debido a que este valor prob es menor que elsignificancia ϭ 001 se concluye que la regresioacuten completa es significativa De esta mapuede usar la p de ANOVA como prueba sin tener que utilizar la tabla 6 del apeacutendice para bvalor criacutetico de F Esto es anaacutelogo a la manera en que se usaron los valores de p en la figura ra probar la significancia de las variables explicativas individuales

Multicolinealidad en la regresioacuten muacuteltiple

En el anaacutelisis de regresioacuten muacuteltiple los coeficientes de regresioacuten a menudo se vuelven

confiables conforme aumenta el grado de correlacioacuten entre las variables independie

existe un alto nivel de correlacioacuten entre algunas de las variables independientes nos enfrenun problema que los estadiacutesticos llaman multicolinealidad

La multicolinealidad puede presentarse si deseamos estimar la recuperacioacuten de las ventaempresa y utilizamos tanto el nuacutemero de vendedores empleados como sus salarios totales Cvalores asociados con estas dos variables independientes tienen una correlacioacuten alta neceusar soacutelo un conjunto de ellos para realizar nuestra estimacioacuten De hecho al agregar una segriable que estaacute correlacionada con la primera se distorsionan los valores de los coeficientgresioacuten Sin embargo a menudo podemos predecir bien Y incluso cuando haya multicoline

Consideremos un ejemplo donde existe multicolinealidad para ver coacutemo afecta a la regresrante los 12 meses pasados el gerente del restaurante Pizza Shack ha estado poniendo unaanuncios en el perioacutedico local Los anuncios se programan y pagan el mes anterior a que ap

Un ejemplo demulticolinealidad

Definicioacuten y efecto dela multicolinealidad

9703ᎏ

0082

29109 3ᎏ

0491 6Prueba de lasignificancia de laregresioacuten en elproblema del Serviciode Contribuciones

Anaacutelisis devarianza parala regresioacuten

Prueba F de laregresioacuten como

un todo

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 29 1088 9 7029 118 52 0Er r or 6 0 4912 0 0819Tot al 9 29 6000

FIGURA 13-5Salida de Minitabanaacutelisis devarianza

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2556

Cada anuncio contiene un cupoacuten que permite llevarse dos pizzas pagando solamente la de mcio El gerente recolectoacute los datos de la tabla 13-4 y le gustariacutea utilizarlos para predecir las vpizzas

En las figuras 13-6 y 13-7 se dieron los resultados de Minitab para las regresiones respelas ventas totales sobre el nuacutemero de anuncios y sobre el costo

Para la regresioacuten sobre el nuacutemero de anuncios tenemos que el valor t observado es 395grados de libertad y un nivel de significancia de ϭ 001 se encontroacute que el valor t criacuteticdo de la tabla 2 del apeacutendice) es 3169 Como t o Ͼ t c (o de manera equivalente como p es m001) concluimos que el nuacutemero de anuncios es una variable explicativa altamente signifilas ventas totales Note tambieacuten que r 2 ϭ 610 de modo que el nuacutemero de anuncios explximadamente el 61 de la variacioacuten en las ventas de pizzas

Para la regresioacuten sobre el costo de los anuncios el valor t observado es 454 de modo qude los anuncios es una variable explicativa de las ventas totales todaviacutea maacutes significativa que ro de anuncios (para los que el valor t observado fue soacutelo 395) En esta regresioacuten r 2 ϭ 673

el costo de los anuncios explica aproximadamente el 67 de la variacioacuten de las ventas de pizComo ambas variables explicativas son altamente significativas por siacute mismas intentam

zar ambas en una regresioacuten muacuteltiple El resultado se presenta en la figura 13-8La regresioacuten muacuteltiple es altamente significativa como un todo ya que la p de ANOVA e

Uso de ambas varia-bles explicativas enuna regresioacuten muacuteltiple

Dos regresionessimples

Datos de ventas y anun-cios para el restaurantePizza Shack

Tabla 13-4 X 1 X 2 Y

Nuacutemero Costo de anuncios Venta tode anuncios publicados de pizz

Mes publicados (cientos de doacutelares) (miles de d

Mayo 12 139 436

Junio 11 120 380

Julio 9 93 301

Agosto 7 97 353

Septiembre 12 123 464

Octubre 8 114 342

Noviembre 6 93 302

Diciembre 13 143 407

Enero 8 102 385

Febrero 6 84 226

Marzo 8 112 376

Abril 10 111 352

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esVENTAS = 16 9 + 2 08 ANUNCI OS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 16 937 4 982 3 40 0 007ANUNCI OS 2 0832 0 5271 3 95 0 003

s = 4 206 R- s q = 61 0

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 1 276 31 276 31 15 62 Er r or 10 176 88 17 69Tot a l 11 453 19

Figura 13-6

Regresioacuten de lasventas sobre elnuacutemero deanuncios conMinitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2656

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2756

gar el nuacutemero de anuncios como segunda variable explicativa ademaacutes del costo de los anuncios eplica nada maacutes alrededor del 1 adicional de la variacioacuten de las ventas totales

En este punto es justo preguntarse iquestqueacute variable realmente explica la variacioacuten de las ventotales en la regresioacuten muacuteltiple La respuesta es que ambas la explican pero no podemos separ

sus contribuciones individuales debido a que estaacuten altamente correlacionadas entre siacute E

consecuencia sus coeficientes en la regresioacuten muacuteltiple tienen errores estaacutendar altos valore

calculados relativamente bajos y valores prob Ͼ | t | relativamente altos

iquestDe queacute manera nos afecta esta multicolinealidad Todaviacutea podemos hacer predicciones relativmente precisas cuando se encuentra presente note que para la regresioacuten muacuteltiple (la salida se dala figura 13-8) el error estaacutendar de la estimacioacuten que determina el ancho de los intervalos de co

fianza para las predicciones es 3989 mientras que para la regresioacuten simple con el costo de los anucios como variable explicativa (salida en la figura 13-7) tenemos se ϭ 3849 Lo que no podemhacer es predecir con mucha precisioacuten coacutemo cambiaraacuten las ventas si aumentamos en uno el nuacutemede anuncios La regresioacuten muacuteltiple dice que b1 ϭ 0625 (esto es cada anuncio aumenta las ventotales de pizzas alrededor de $625) pero el error estaacutendar de este coeficiente es 112 (es decir apximadamente $1120)

Las contribucionesindividuales nopueden separarse

Ejercicios 134

Ejercicios de autoevaluacioacuten

EA 13-4 Edith Pratt es una ocupada ejecutiva de una compantildeiacutea de transporte de carga a nivel nacional y va tara una junta porque no encuentra la salida de la regresioacuten muacuteltiple elaborada por un asistente Si la regsioacuten total es significativa al nivel 005 ella desea usar las salida de computadora como evidencia para fudamentar algunas ideas que expondraacute en la reunioacuten Sin embargo su ayudante estaacute enfermo De hectoda la informacioacuten que tiene de la regresioacuten muacuteltiple es un trozo de papel con los siguientes datos

Regresioacuten paraEdith Pratt

SCR 8724 con gl

SCE con 17 gl

SCT 10236 con 24 gl

Como el papel ni siquiera tiene todos los nuacutemeros Edith ha concluido que no es uacutetil Usted sin embardebe saber maacutes que ella iquestPuede Edith entrar en la junta o debe seguir buscando la salida de computador

EA 13-5 Una pequentildea liacutenea aeacuterea de Nueva Inglaterra realizoacute una encuesta sobre sus 15 terminales y obtuvo losguientes datos para el mes de febrero donde

VENTAS ϭ ingreso total seguacuten el nuacutemero de boletos vendidos (en miles de doacutelares)

PROMOCϭ cantidad gastada en promociones de la liacutenea aeacuterea en el aacuterea (en miles de doacutelares)

COMPET ϭ nuacutemero de liacuteneas aeacutereas que compiten en esa terminal

GRATIS ϭ nuacutemero de pasajeros que vuelan gratis (por diferentes razones)

Sugerencia el concepto de hacer infe-rencias respecto a una regresioacuten muacutelti-ple es justo lo mismo que se hizo en elcapiacutetulo 12 cuando hicimos inferencias

respecto a una recta de regresioacuten excepto que ahora se em-

plean dos o maacutes variables independientes Advertencia lamulticolinealidad es un problema que debe manejarse enla regresioacuten muacuteltiple y es necesario desarrollar una com-prensioacuten con sentido comuacuten Recuerde que todaviacutea puedehacer predicciones precisas cuando estaacute presente Pero re-cuerde tambieacuten que no puede decir con mucha precisioacuten

cuaacutento cambiaraacute la variable dependiente si ldquomanipulardquo lavariables independientes Entonces el objetivo debe seminimizar la multicolinealidad Sugerencia la mejor regresioacuten muacuteltiple es la que explica la relacioacuten entre los datos asentildealar la responsabilidad de la mayor proporcioacuten de la va

riacioacuten en la variable dependiente con el menor nuacutemero dvariables independientes Advertencia no es una buenidea incluir demasiadas variables independientes soacutelo porque cuenta con una computadora y un paquete de softwarpara estadiacutestica

SUGERENCIAS

Y

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2856

Ventas (doacutelares) Promoc (doacutelares) Compet Gratis

793 25 10 3

2001 55 8 6

1632 60 12 9

2001 79 7 16

1460 52 8 15

1777 76 12 9

309 20 12 8

2919 90 5 10

1600 40 8 43394 96 5 16

1596 55 11 7

863 30 12 6

2375 60 6 10

1072 50 10 4

1550 35 10 4

a) Utilice la siguiente salida de Minitab para determinar la ecuacioacuten de regresioacuten que mejor se ara la liacutenea aeacuterea

La ec uaci oacuten de r egr es i oacuten esVENTAS ϭ 172 ϩ 25 9 PROMOVϪ 13 2 COMPET Ϫ 3 04 GRATI S

Pr onos t i cador Coef Des vEs t Coci ent e - t Cons t ant e 172 34 51 38 3 35 0PROMOV 25 950 4 877 5 32 0COMPET - 13 238 3 686 - 3 59 0GRATI S - 3 041 2 342 - 1 30 0

b) iquestLos pasajeros que vuelan gratis ocasionan una disminucioacuten significativa en las ventas Fpruebe las hipoacutetesis apropiadas Use ϭ 005

c) iquestUn incremento de $1000 en las promociones cambia las ventas en $28000 o el cambio ecativamente diferente de $28000 Formule y pruebe las hipoacutetesis adecuadas Use ϭ 010

d) Calcule un intervalo de confianza del 90 para el coeficiente de la pendiente de la COMPET

Aplicaciones

13-22 Mark Lowtown publica el perioacutedico Mosquito Junction Enquirer y tiene problemas para predectidad de papel perioacutedico que necesita imprimir diariamente Eligioacute aleatoriamente 27 diacuteas del arior y registroacute la siguiente informacioacuten

PESO ϭ peso en libras de papel perioacutedico para la edicioacuten de ese diacutea

CLASIFICADOS ϭ nuacutemero de anuncios clasificados

PUBLICIDAD ϭ nuacutemero de anuncios publicitarios

PLANA COMPLETA ϭ nuacutemero de anuncios a una plana

Utilizando Minitab para hacer una regresioacuten de PESO sobre las otras tres variables Mark obtuguiente salida

Pr onos t i cador Coef Des vEs t Coci ent e- t Cons t ant e 1072 95 872 43 1 23 0CLASI FI CADOS 0 251 0 126 1 99 0PUBLI CI DAD 1 250 0 884 1 41 0PLANA COMPLETA 250 66 67 92 3 69 0

a) Mark siempre ha pensado que cada anuncio publicitario utiliza al menos 3 libras de papel iquestsioacuten le da una razoacuten significativa para dudar esto al nivel del 5

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2956

b) De manera similar Mark siempre ha creiacutedo que cada anuncio clasificado utiliza aproximmedia libra de papel iquestTiene ahora Mark una razoacuten significativa para dudar esto al nivel del

c) Mark vende espacios de anuncios de plana completa a los comerciantes locales a $30 la paacutegberaacute pensar en ajustar sus tarifas si el papel perioacutedico le cuesta $009 por libra Suponga costos son despreciables Establezca expliacutecitamente las hipoacutetesis y una conclusioacuten (Sugere

jando todo lo demaacutes constante cada anuncio adicional de plana completa tiene un costo de bras de papel ϫ $009 por libra ϭ $2256 El punto de equilibrio es 333333 libras iquestPor quel coeficiente de pendiente para PLANA COMPLETA es significativamente mayor que Mark no estaacute obteniendo ganancias y debe cambiar sus tarifas)

13-23 Para los datos del ejercicio 13-18 y un nivel de significancia de 010 iquestcuaacuteles variables son sign

mente explicativas de los resultados de los exaacutemenes (Habiacutea 12 estudiantes en la muestra) 13-24 Para los datos del ejercicio 13-18 y la siguiente salida de Minitab del procedimiento de regresiple hecho por Bill

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 3134 42 783 60Er r or 7 951 25 135 89Tot a l 11 4085 67

a) iquestCuaacutel es el valor observado de F b) A un nivel de significancia de 005 iquestcuaacutel es el valor criacutetico de F que se debe utilizar para d

si la regresioacuten como un todo es significativac) Basaacutendose en las respuestas a los incisos a) y b) iquestes la regresioacuten significativa como un tod

13-25 Remiacutetase al ejercicio 13-19 A un nivel de significancia de 001 iquestes la variable DISTANCIA uble explicativa significativa para VENTAS

13-26 Para los datos del ejercicio 13-19 y la siguiente salida adicional de Minitab al correr la regresioacuten

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 2861495 715374 102 39 0Er r or 18 125761 6896 7Tot a l 22 2987256

Al nivel de significancia de 005 iquestes la regresioacuten significativa como un todo

13-27 Henry Lander es el director de produccioacuten de la Alecos Corporation de Caracas Venezuela Hede que le ayude a determinar una foacutermula para predecir el ausentismo de los empacadores de chipoacutetesis es que la temperatura diaria promedio puede explicar el porcentaje de ausentismo Durios meses reuacutene datos ejecuta el procedimiento de regresioacuten simple y encuentra que la tempeplica 66 de la variacioacuten en el ausentismo Pero Henry no estaacute convencido de que eacuteste sea un cador satisfactorio Sugiere que la precipitacioacuten pluvial diaria podriacutea tambieacuten tener algo que vausentismo de modo que registra los datos correspondientes y hace una regresioacuten del ausentismte el tiempo de lluvias y obtiene un valor R2 de 059 ldquoiexclEurekardquo grita usted ldquoiexclLo tengo Con uticador que explica 66 y otro que explica 59 todo lo que tengo que hacer es una regresioacutenutilizando ambos y seguramente tendreacute un pronosticador casi perfectordquo Para su desaacutenimo sin la regresioacuten muacuteltiple tiene una R

2 de soacutelo 68 que es solamente un poco mejor que la variablperatura sola iquestCoacutemo puede explicar esta aparente discrepancia

13-28 Juan Armenlegg administrador de Rockyrsquos Diamond y Jewelry Store estaacute interesado en desamodelo para estimar la demanda del consumidor para su costosa mercanciacutea Como la mayoriacutea de

tes compran diamantes y joyas a creacutedito Juan estaacute seguro de que dos factores que deben influirmanda de los clientes son la tasa real de inflacioacuten anual y la tasa real de intereses sobre preacutestamprincipales bancos del paiacutes Explique algunos problemas que Juan podriacutea encontrar si fuera a dun modelo de regresioacuten basado en estas dos variables de prediccioacuten

13-29 Un nuevo programa de juegos Check That Model pide a los concursantes que especifiquen el nuacutenimo de paraacutemetros que necesitan para determinar si un modelo de regresioacuten muacuteltiple es signifimo un todo para ϭ 001 Usted ganoacute la apuesta con 4 paraacutemetros Use la siguiente informacioacutenterminar si la regresioacuten es significativa

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3056

R 2

ϭ 07452

SCE ϭ 1254

n ϭ 18

Nuacutemero de variables independientes ϭ 3

13-30 La Scottish Turist Agency estaacute interesada en el nuacutemero de turistas que entran al paiacutes cada semanrante la temporada alta Se recolectaron los siguientes datos

Turistas (Y ) ϭ nuacutemero de turistas que entran a Escocia en una semana (en miles)

Cambio (X 1)ϭ nuacutemero de libras escocesas compradas por $1 doacutelar

Precio (X 2) ϭ nuacutemero de libras escocesas cobradas por viaje redondo en camioacuten de Londres a Edimburgo

Promoc (X 3) ϭ cantidad gastada en promocioacuten del paiacutes (en miles de libras escocesas)Temp (X 4) ϭ temperatura media durante la semana en Edimburgo (en grados Celsius)

Turistas (Y ) Cambio (X 1) Precio (X 2) Promoc (X 3) Temp (X 4)

69 061 40 87 154

71 059 40 88 156

68 063 40 85 154

79 061 35 86 153

76 060 35 94 158

82 065 35 99 162

80 058 35 98 164

84 059 35 102 166

97 061 30 114 174

98 062 30 116 172

72 057 40 84 176

67 055 40 86 164

a) Utilice el paquete de software que tenga para determinar la ecuacioacuten de regresioacuten que mejote a los datos de la agencia de turismo

b) iquestEs la tasa de cambio una variable explicativa significativa Establezca y pruebe las hipoacutetesidas a un nivel de significancia de 010

c) Un incremento de 1000 libras en las promociones iquestaumenta el nuacutemero de turistas en maacutesEstablezca y pruebe las hipoacutetesis adecuadas para un nivel de significancia de 005

d) Calcule un intervalo de confianza del 95 para el coeficiente de la pendiente de Temp

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-4 Como SCT ϭ SCR ϩ SCE SCE ϭ SCT Ϫ SCR ϭ 10236 Ϫ 8724 ϭ 1512Como gl SCT ϭ gl SCR ϩ gl SCE gl SCR ϭ gl SCT Ϫ gl SCE ϭ 24 Ϫ 17 ϭ 7

Entonces F ϭ ϭ ϭ 1401

F CRiacuteT ϭ F (7 17 005) ϭ 261Como F OBS gt F CRIacuteT se concluye que la regresioacuten es significativa como un todo Edith debe conticando la salida de computadora de la regresioacuten para usarla en la junta

EA 13-5 De la salida de computadora se obti enen los siguientes resultadosa) VENTAS ϭ 17234 ϩ 25950PROMOC Ϫ13238COMPET Ϫ 3041GRATISb) H0 BGRATIS ϭ 0 H1 BGRATIS Ͻ 0 ϭ 005

Eacutesta es una prueba de una cola y el valor prob en los resultados es para la alternativa de dos c BGRATIS 0 De manera que para esta prueba el valor prob es 02212 ϭ 0111 Ͼ ϭ 00que no se puede rechazar H0 las ventas no disminuyen significativamente cuando aumenta ro de pasajeros que vuelan gratis

c) H0 BPROMOC ϭ 28 H1 BPROMOC 28 ϭ 010

87247ᎏᎏ

151217SCRk ᎏᎏ

SCE(n Ϫ k Ϫ 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3156

El valor observado t de los resultados de regresioacuten es

ϭ ϭ Ϫ0420

Con 11 grados de libertad y ϭ 010 en ambas colas combinadas los valores criacuteticos t parba son Ϯ1796 asiacute el valor observado estaacute dentro de la regioacuten de aceptacioacuten No se rechacambio en VENTAS para un incremento de una unidad ($1000) en PROMOC no es significate diferente de 28 ($28000)

d) Con 11 grados de libertad el valor t para un intervalo del 90 de confianza es 1796 por lo

tervalo esbCOMP Ϯ 1796sbCOMP

ϭ Ϫ13238 Ϯ 1796(3686)

ϭ Ϫ13238 Ϯ 6620 ϭ (Ϫ19858 Ϫ 6618)

La liacutenea aeacuterea puede tener una seguridad del 90 de que el ingreso por los boletos en una ofminuye entre $6600 y $19900 aproximadamente con cada liacutenea aeacuterea adicional que comp

135 Teacutecnicas de modelado

Dada una variable que deseamos explicar y un conjunto de variables explicativas potencialehaya varias ecuaciones de regresioacuten diferentes que podamos estudiar dependiendo de queacute explicativas incluyamos y de coacutemo lo hagamos Cada una de esas ecuaciones de regresioacutence como modelo Las teacutecnicas de modelado son las distintas formas en que podemos incluriables explicativas y verificar queacute tan apropiados son los modelos de regresioacuten Existen municas de modelado diferentes pero soacutelo veremos dos de las maacutes utilizadas

Datos cualitativos y variables ficticias

En todos los ejemplos de regresioacuten que hemos visto hasta ahora los datos manejados hanmeacutericos o cuantitativos Pero ocasionalmente nos enfrentaremos con una variable categoacuterilitativa En el problema del inicio el capiacutetulo el director de personal desea ver si el salarioun vendedor depende de su sexo En la tabla 13-5 repetimos los datos de dicho problema

Por el momento ignore la antiguumledad y utilice la teacutecnica desarrollada en el capiacutetulo 9 bar la diferencia entre las medias de dos poblaciones para ver si los hombres ganan maacutes qu

jeres Pruebe con ϭ 001 Si tomamos a los hombres como la poblacioacuten 1 y a las mujerespoblacioacuten 2 probaremos las siguientes hipoacutetesis

H0 1 ϭ 2 larr Hipoacutetesis nula no existe discriminacioacuten por sexo en los salarios base

H1 1 Ͼ 2 larr Hipoacutetesis alternativa se discrimina a las mujeres en su salario base

ϭ 001 larr Nivel de significancia

Revisioacuten del enfoqueanterior del problema

Buacutesqueda dediferentes modelos

25950 Ϫ 28ᎏᎏ

4877

(bPROMOC Ϫ 28)ᎏᎏ

sbPROMOC

Datos para el problemade discriminacioacuten porsexo

Tabla 13-5 Vendedores VendedorasAntiguumledad Salario base Antiguumledad Salario base(en meses) (en miles) (en meses) (en miles)

6 75 5 62

10 86 13 87

12 91 15 94

18 103 21 98

30 130

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3256

A continuacioacuten bosquejamos el anaacutelisis Si tiene problemas para seguirlo deberaacute repasamente la seccioacuten 93

n1 ϭ 5 n2 ϭ 4

x ෆ1 ϭ 97 x ෆ2 ϭ 8525

s2

1 ϭ 4415 s2

2 ϭ 2609

s2

p ϭ

ϭ

ϭ 3641

x ෆ1Ϫ x

ෆ2ϭ s pΊ ϩ

ϭ 128

t ϭ

ϭ

ϭ 092

Con siete grados de libertad el valor t criacutetico para una prueba de cola superior con ϭ 001 eComo el valor t observado de 092 es menor que 2998 no podemos rechazar H0

Entonces el anaacutelisis concluye que no parece haber discriminacioacuten por sexo en los salarPero recuerde que hasta ahora se han ignorado los datos de antiguumledad laboral para el anaacuteli

Antes de seguir vea el diagrama de dispersioacuten de los datos En la figura 13-9 los punto

corresponden a los hombres y los blancos a las mujeres El diagrama de dispersioacuten muestraridad que el salario base aumenta con los antildeos de antiguumledad pero si con la mirada sigue lo qla recta de regresioacuten notaraacute que los puntos negros tienden a estar arriba de ella y los blancos

La figura 13-10 da la salida de una regresioacuten del salario base sobre los meses de antiguumlelos resultados se ve que la antiguumledad es una variable explicativa altamente significativa

Ademaacutes r 2

ϭ 926 que indica que la variable meses de antiguumledad explica cerca del 9variacioacuten en el salario base La figura 13-11 contiene parte de la salida que no se vio antesbla de residuos Para cada punto el residuo es simplemente Y Ϫ Y ˆ que se reconoce como el

Una ldquomiradardquo a los

datos

El enfoque anterior nodetecta discriminacioacuten

(97 ndash 8525) ndash 0ᎏᎏ

128

( x ෆ1 ndash x ෆ2) ndash (1 Ϫ 2)H0

ᎏᎏᎏ

ˆ x ෆ1Ϫ

x ෆ2

1ᎏ

n2

1ᎏ

n1

4(4415) ϩ 3(2609)ᎏᎏᎏ5 ϩ 4 ndash 2

(n1 ndash 1)s21 ϩ (n2 ndash 1)s22ᎏᎏᎏ

n1 ϩ n2 ndash 2

FIGURA 13-9

Diagrama de dis-persioacuten de salariosbase contra mesesde antiguumledad

4 8 12 16 20 24 28

4

8

12

Meses de antiguumledad

S a l a r i o ( m i l e s d e d oacute l a r e s )

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3356

el ajuste de la recta de regresioacuten en ese punto En la figura 13-11 AJUST1 son los valores y RESI1 son los residuos

Tal vez la parte maacutes importante del anaacutelisis del resultado de una regresioacuten sea estusiduos Si la regresioacuten incluye todos los factores explicativos relevantes estos residuo

ser aleatorios Dicho de otro modo si los residuos muestran cualquier patroacuten no aleat

to indica que hay algo sistemaacutetico que afecta el proceso y que no hemos tomado en cu

manera que buscamos patrones en los residuos o para decirlo de forma maacutes pintoresca ldquopmos a los residuos hasta hacerlos hablarrdquo

Si observamos los residuos presentados en la figura 13-11 vemos que los primeros cincoson positivos De modo que para los vendedores tenemos Y ndash Y ˆ Ͼ 0 o Y Ͼ Y ˆ es decir laregresioacuten cae abajo de estos cinco puntos Tres de los cuatro uacuteltimos residuos son negaticonsiguiente para las vendedoras tenemos Y Ϫ Y ˆ Ͻ 0 o Y Ͻ Y ˆ asiacute que la recta de regresicuentra arriba de tres de los cuatro puntos Esto confirma lo que vimos al observar el diagdispersioacuten de la figura 13-9 Este patroacuten no aleatorio en los residuos sugiere que el sexo siacute etor determinante del salario base

iquestCoacutemo podemos incorporar el sexo de los vendedores dentro del modelo de regresioacutencemos utilizando un dispositivo llamado variable ficticia (o variable indicadora) Para lpuntos que representan a los vendedores esta variable tiene valor de 0 y para los cuatro purepresentan a las vendedoras valdraacute 1 Los datos de entrada para nuestra regresioacuten con variticias se dan en la tabla 13-6

Para los datos de la tabla 13-6 se ajusta una regresioacuten de la forma

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

Uso de variablesficticias

Deteccioacuten depatrones en losresiduos

ldquoPresionar a losresiduosrdquo

Anaacutel i s i s de r e gr e s i oacuten

La ec uac i oacuten de r e gr es i oacuten esSALARI O ϭ 5 81 ϩ 0 233 MESES

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t pCons t a nt e 5 8093 0 4038 14 39 0 000MESES 0 23320 0 02492 9 36 0 000

s ϭ 0 5494 R- s q ϭ 92 6

Anaacute l i s i s de va r i a nz aFUENTE GL SC MC F Re gr e s i oacuten 1 26 443 24 443 87 61 0Er r or 7 2 113 0 302Tot a l 8 28 556

FIGURA 13-10

Regresioacuten conMinitab del salariobase sobre losmeses deantiguumledad

RENGLOacuteN SALARI O AJ UST1 RESI 1

1 7 5 7 2085 0 2914992 8 6 8 1413 0 458684

3 9 1 8 6077 0 4922764 10 3 10 0069 0 2930545 13 0 12 8054 0 1946076 6 2 6 9753 - 0 7752977 8 7 8 8409 - 0 1409288 9 4 9 3073 0 0926649 9 8 10 7066 - 0 906558

FIGURA 13-11

Tabla de residuosde Minitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1056

EA 13-2 a) En este problema Y ϭ renta X 1 ϭ nuacutemero de habitaciones X 2 ϭ distancia al centro

Y X 1 X 2 X 1Y X 2Y X 1X 2 X 2

1 X 2

2 Y 2

360 2 1 720 360 2 4 1 129600

1000 6 1 600 1000 6 36 1 1000000

450 3 2 1350 900 6 9 4 202500

525 4 3 2100 1575 12 16 9 272625

350 2 10 700 3500 20 4 100 122500

300 1 4 300 1200 4 1 16 90000

2985 18 21 11170 8535 50 70 131 1820225

Las ecuaciones 13-2 13-3 y 13-4 se convierten en

Y ϭ na ϩ b1 X 1 ϩb2 X 2 2985 ϭ 6a ϩ 18b1 ϩ 21b2

X 1Y ϭ a X 1 ϩ b1 X 21 ϩb2 X 1 X 2 11170 ϭ 18a ϩ 70b1 ϩ 50b2

X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22 8535 ϭ 21a ϩ 50b1 ϩ 131b2

Al resolver estas ecuaciones simultaacuteneas se obtiene

a ϭ 964581 b1 ϭ 1364847 b2 ϭ Ϫ24035

De manera que la ecuacioacuten de regresioacuten es

Y ˆ ϭ 964581 ϩ 1364847 X 1 Ϫ 24035 X 2

b) Cuando el nuacutemero de habitaciones ϭ 2 y la distancia al centro ϭ 2

Y ˆ ϭ 964581 ϩ 1364847(2) Ϫ 24035(2) ϭ $365

133 La computadora y la regresioacutenmuacuteltiple

En el capiacutetulo 12 y hasta donde vamos de eacuteste hemos presentado problemas simplificados y muestrasde tamantildeo pequentildeo Despueacutes del ejemplo de la seccioacuten anterior probablemente usted haya llegadoa la conclusioacuten de que no estaacute interesado en la regresioacuten si tiene que hacer los caacutelculos a mano Dehecho conforme aumenta el tamantildeo de las muestras y crece el nuacutemero de variables independientespara la regresioacuten hacer los caacutelculos incluso con la ayuda de una calculadora de bolsillo se convier-te en algo muy inconveniente

Sin embargo como administradores debemos manejar problemas complejos que requieren mues-tras maacutes grandes y variables independientes adicionales Como ayuda para resolver estos problemasmaacutes detallados utilizaremos una computadora que nos permitiraacute realizar un gran nuacutemero de caacutelcu-los en poco tiempo

Suponga que tenemos no una ni dos variables independientes sino un nuacutemero k de ellas X 1

X 2 X k Como antes sea n el nuacutemero de datos que se tienen La ecuacioacuten de regresioacuten que inten-tamos estimar es

Inconvenienciadel caacutelculo deregresiones a mano

Ecuacioacuten de estimacioacuten de regresioacuten muacuteltiple

Y ˆ ϭ

b1 X 1ϩ

b2 X 2ϩ ϩ

bk X k [13-5]

Ahora veremos coacutemo podemos utilizar una computadora para estimar los coeficientes de regresioacutenPara demostrar coacutemo una computadora maneja el anaacutelisis de regresioacuten muacuteltiple tomemos el pro-

blema del Servicio Interno de Contribuciones (IRS) de la seccioacuten anterior Suponga que el departa-mento de auditoriacuteas agrega a su modelo la informacioacuten correspondiente a las recompensas para losinformantes La dependencia desea incluir esta tercera variable independiente X 3 debido a que sien-

Demostracioacuten de laregresioacuten muacuteltipleen la computadora

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1156

te que existe cierta relacioacuten entre estas recompensas y el descubrimiento de impuestos no pEn la tabla 13-3 se registroacute la informacioacuten de los uacuteltimos 10 meses

Para resolver este problema la divisioacuten de auditoriacutea usoacute el procedimiento de regresioacutende Minitab Por supuesto todaviacutea no sabemos coacutemo interpretar la solucioacuten que proporciocomo veremos la mayor parte de los nuacutemeros dados en la solucioacuten corresponden muy de c

los estudiados en el contexto de regresioacuten simple

Salida de Minitab

Una vez que se introducen los datos y se eligen las variables dependiente e independientescalcula los coeficientes de regresioacuten y varios estadiacutesticos asociados con la ecuacioacuten de regrveraacute la salida del programa para el problema del IRS La figura 13-2 da la primera parte de la

1 La ecuacioacuten de regresioacuten De los nuacutemeros dados en la columna Coef se puede leercioacuten de estimacioacuten

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ b3 X 3

ϭ Ϫ45796 ϩ 0597 X 1 ϩ 1177 X 2 ϩ 0405 X 3

Podemos interpretar esta ecuacioacuten en una forma similar a la de la ecuacioacuten de regresioacutevariables en la paacutegina 558 Si se mantienen constantes el nuacutemero de horas de audicampo X 1 y el nuacutemero de horas de computadora X 2 y se cambian las recompeninformantes X 3 entonces el valor de Y ˆ aumentaraacute $405000 por cada $1000 pagadosformantes De igual manera al mantener X 1 y X 3 constantes se ve que por cada 1adicionales de tiempo de computadora Y ˆ aumentaraacute $1177000 Por uacuteltimo si se dej

Buacutesqueda e interpre-tacioacuten de la ecuacioacutende regresioacuten

Salida del programaMinitab

Uso de Minitab pararesolver problemasde regresioacuten muacuteltiple

Factores relacionadoscon el descubrimientode impuestos nopagados

Tabla 13-3 Horas en Impueauditoriacuteas Horas Recompensa pagde campo en computadora a informantes descub(cientos) (cientos) (miles) (mill

Mes X 1 X 2 X 3

Enero 45 16 71 2

Febrero 42 14 70 2

Marzo 44 15 72 2

Abril 45 13 71 2

Mayo 43 13 75 2

Junio 46 14 74 2

Julio 44 16 76 3

Agosto 45 16 69 2

Septiembre 44 15 74 2

Octubre 43 15 73 2

FIGURA 13-2

Salida de Minitabpara la regresioacuten

del ServicioInterno deContribuciones

Anaacutel i s i s de r e gr e s i oacuten

La ec ua ci oacuten de r egr es i oacuten es

DESCUBRE ϭ mdash45 0 ϩ 0 597 AUDI T ϩ 1 18 COMPUTADORA ϩ 0 405 RECOMPENS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e Ϫ45 796 4 878 Ϫ9 39 0 000AUDI T 0 50697 0 08112 7 36 0 000COMPUTADORA 1 17684 0 08407 14 00 0 000RECOMPENSA 0 40511 0 04223 9 59 0 000

s ϭ 0 2861 R- s q ϭ 98 3

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1256

tantes X 2 y X 3 se estima que 100 horas adicionales dedicadas a auditoriacuteas de campo descubri-raacuten $597000 adicionales de impuestos no pagados Observe que se redondearon los valoresproporcionados por la regresioacuten dada por Minitab (figura 13-2)

Suponga que en noviembre el IRS intenta dejar las horas de trabajo en auditoriacuteas de cam-po y las horas en computadora en sus niveles de octubre (4300 y 1500) pero decide aumen-tar las recompensas pagadas a los informantes a $75000 iquestCuaacutento de impuestos no pagadosesperan descubrir en noviembre Sustituyendo estos valores en la ecuacioacuten de regresioacuten esti-mada obtenemos

Y ˆ ϭ Ϫ45796 ϩ 0597 X 1 ϩ 1177 X 2 ϩ 0405 X 3

Y ˆ ϭ Ϫ45796 ϩ 0597(43) ϩ 1177(15) ϩ 0405(75)

Y ˆ ϭ Ϫ45796 ϩ 25671 ϩ 17655 ϩ 30375

Y ˆ ϭ 27905 larr Descubrimientos estimados $27905000

De modo que el departamento de auditoriacuteas espera descubrir aproximadamente $28 millonesde evasioacuten de impuestos en noviembre

2 Una medida de dispersioacuten el error estaacutendar de la estimacioacuten de la regresioacuten muacuteltiple Ya quehemos determinado la ecuacioacuten que relaciona a nuestras tres variables necesitamos una me-dida de la dispersioacuten alrededor de este plano de regresioacuten muacuteltiple En la regresioacuten simple laestimacioacuten es maacutes precisa conforme el grado de dispersioacuten alrededor de la regresioacuten es menorLo mismo es cierto para los puntos de la muestra que se encuentran alrededor del plano de re-gresioacuten muacuteltiple Para medir esta variacioacuten debemos utilizar de nuevo la medida conocida co-

mo error estaacutendar de la estimacioacuten

Medicioacuten de ladispersioacuten alrededordel plano de regre-sioacuten muacuteltiple usodel error estaacutendar dela estimacioacuten

Error estaacutendar de la estimacioacuten

se ϭ Ί [13-6]Y ndash Y ˆ )2ᎏᎏ

n Ϫ k Ϫ 1

donde

bull Y ϭ valores muestrales de la variable dependientebull Y ˆ ϭ valores correspondientes estimados con la ecuacioacuten de regresioacutenbull n ϭ nuacutemero de puntos de la muestrabull k ϭ nuacutemero de variables independientes (ϭ 3 en nuestro ejemplo)

El denominador de esta ecuacioacuten indica que en la regresioacuten muacuteltiple con k variables in-

dependientes el error estaacutendar tiene n Ϫ k Ϫ 1 grados de libertad Esto se debe a que los

grados de libertad se reducen de n en k ϩ 1 constantes numeacutericas a b1 b2 hellip b k que se

estimaron a partir de la misma muestra

Para calcular se observamos los errores individuales (Y Ϫ Y ˆ ) en el plano de regresioacuten ajus-tado los elevamos al cuadrado calculamos su media (dividiendo entre n Ϫ k Ϫ 1 en lugar den) y tomamos la raiacutez cuadrada del resultado Debido a la forma en que se calcula se se cono-ce a veces como raiacutez del error cuadraacutetico medio [o raiacutez de mse (mean-square error)] De lasalida de Minitab que usa s en lugar de se para denotar el error estaacutendar vemos que la raiacutez demse en el problema del Servicio Interno de Contribuciones es 0286 es decir $286000

Como en el caso de la regresioacuten simple podemos utilizar el error estaacutendar de la estimacioacuteny la distribucioacuten t para formar un intervalo de confianza alrededor de nuestro valor estimadoY ˆ En el problema de la evasioacuten de impuestospara 4300 horas de trabajo en auditoriacuteas de cam-po 1500 horas en computadora y $75000 de pago a informantes Y ˆ es $27905000 como es-timacioacuten de impuestos no pagados descubiertos y se es $286000 Si deseamos construir unintervalo de confianza del 95 alrededor de esta estimacioacuten de $27905000 miramos enla tabla 2 del apeacutendice en la columna del 5 y localizamos ahiacute el rengloacuten correspondiente a

Intervalos deconfianza para Y ˆ

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1356

n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad El valor apropiado de t para nuestracioacuten del intervalo es de 2447 En consecuencia podemos calcular los liacutemites de nutervalo de confianza como sigue

Y ˆ ϩ t (se) ϭ 27905000 ϩ (2447)(286000)

Y ˆ ϩ t(se) ϭ 27905000 ϩ 699800

Y ˆ ϩ t(se) ϭ 28604800 larr Liacutemite superior

Y ˆ Ϫ t (se) ϭ 27905000 Ϫ (2447)(286000)

Y ˆ ϩ t(se) ϭ 27905000 ndash 699800

Y ˆ ϩ t(se) ϭ 27205200 larr Liacutemite inferior

Con un nivel de confianza del 95 el departamento de auditoriacuteas puede sentirse sque los descubrimientos reales estaraacuten en este intervalo que va de $27205200 a $28Si el IRS desea usar un nivel de confianza menor como 90 puede reducir el intevalores para la estimacioacuten de descubrimientos de impuestos no pagados Igual que cgresioacuten simple podemos utilizar la distribucioacuten normal estaacutendar (tabla 1 del apeacutendaproximar la distribucioacuten t siempre que los grados de libertad (n menos el nuacutemero cientes de regresioacuten estimados) sea un nuacutemero mayor que 30

Al antildeadir la tercera variable independiente (recompensas a informantes) iquestmejoroacuteregresioacuten Como se mide la dispersioacuten de los datos alrededor del plano de regresioacutenmenores de se deberiacutean indicar mejores regresiones Para la regresioacuten de dos variablecimos con anterioridad en este mismo capiacutetulo se resultoacute ser 1076 Como al agregarra variable se se redujo a 0286 vemos que siacute mejoroacute el ajuste de la regresioacuten en este Sin embargo en general no es cierto que al agregar variables siempre se reduzc

3 El coeficiente de determinacioacuten muacuteltiple Al estudiar el anaacutelisis de correlacioacuten simpmos la fuerza de la relacioacuten entre dos variables utilizando el coeficiente de determinla muestra r 2 Este coeficiente de determinacioacuten es la fraccioacuten de la variacioacuten total riable dependiente Y que se explica con la ecuacioacuten de estimacioacuten

Similarmente en la correlacioacuten muacuteltiple mediremos la fuerza de la relacioacuten entre trbles utilizando el coeficiente de determinacioacuten muacuteltiple R

2 o su raiacutez cuadrada R (el cte de correlacioacuten muacuteltiple) Este coeficiente de determinacioacuten muacuteltiple es tambieacuten la

que representa la porcioacuten de la variacioacuten total de Y que ldquoexplicardquo el plano de regr

Note que la salida del programa da el valor 983 para R2 Esto nos dice que las tr

bles independientes explican el 983 de la variacioacuten total de impuestos no pagadobiertos Para la regresioacuten de dos variables hecha antes R2 es soacutelo 0729 asiacute que las trabajo en auditoriacutea de campo y las horas en computadora explican el 729 de la vaagregar las recompensas a los informantes explica el 254 restante de la variacioacuten

Todaviacutea no hemos explicado los nuacutemeros en las columnas etiquetadas con Desvciente t y p de la figura 13-2 Estos nuacutemeros se utilizaraacuten para hacer inferencias acercano de regresioacuten de la poblacioacuten tema que se trataraacute en la seccioacuten 13-4

Uso del coeficientede determinacioacutenmuacuteltiple

Valor de variablesadicionales

Interpretacioacuten delintervalo deconfianza

Ya nadie calcula regresiones a mano hayotras cosas maacutes interesantes en queacute ocu-par nuestro tiempo Se explicoacute la teacutecnicacalculando las soluciones a mano para

que no tenga que pensar en su computadora como en unaldquocaja negrardquo que hace muchas cosas uacutetiles que no puedeexplicar Sugerencia el valor real de usar la computadorapara calcular regresiones muacuteltiples es que puede manejarmuchas variables independientes y obtener una mejor ecua-

cioacuten de estimacioacuten que puede medir si agregar otrble independiente realmente mejora los resultados yposible observar con rapidez el comportamiento de

indica la proporcioacuten de la variacioacuten total de la variapendiente que se explica con las variables indepenLa computadora hace todo el trabajo tedioso mdashsin semdash y le deja tiempo para el trabajo maacutes importcomprender los resultados y usarlos para tomar mdecisiones

SUGERENCIASY

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1456

La ec uac i oacuten de r egr es i oacuten esY = - 12 75 + 17 1 X1 + 0 54 1 X2 - 0 17 4 X3

Pr onos t i c ador Coe f De s vEs t Coc i e nt e - t pCons t a n t e - 1275 2699 - 0 47 0 719X1 17 059 6 908 2 47 0 245X2 0 5406 0 3144 1 72 0 335X3 - 0 1743 0 1005 - 1 73 0 333

s = 396 1 R- s q = 87 2

b) iquestQueacute porcentaje de la variacioacuten total del nuacutemero de solicitudes urgentes de devolucioacuten de impuestosexplica esta ecuacioacuten

c) Para este antildeo el iacutendice econoacutemico es 169 la poblacioacuten residente en un radio de una milla desde la

oficina es 10212 habitantes y el ingreso promedio en Ithaca es $26925 iquestCuaacutentas solicitudes urgen-tes de devolucioacuten de impuestos debe Pam esperar procesar entre el 1 de marzo y el 15 de abril

Conceptos baacutesicos 13-14 Dado el siguiente conjunto de datos utilice el paquete de software que tenga disponible para encontrar la

ecuacioacuten de regresioacuten de mejor ajuste y responda a lo siguientea) iquestCuaacutel es la ecuacioacuten de regresioacutenb) iquestCuaacutel es el error estaacutendar de la estimacioacutenc) iquestCuaacutel es el valor de R

2 para esta regresioacutend) iquestCuaacutel es el valor pronosticado para Y cuando X 1 ϭ 58 X 2 ϭ 42 y X 3 ϭ 51

Y X 1 X 2 X 3

647 35 53 85809 74 16 26246 25 63 45439 37 94 88777 55 14 36206 83 92 25669 67 25 27343 12 22 13

Ejercicios 133

Ejercicios de autoevaluacioacuten

EA 13-3 Pam Schneider posee y opera un despacho de contadores en Ithaca Nueva York Ella piensa que seriacutea uacutetilpredecir el nuacutemero de solicitudes urgentes de devolucioacuten de impuestos que le pediraacuten durante el ajetrea-do periodo del 1 de marzo al 15 de abril para poder planear mejor sus necesidades de personal duranteesta eacutepoca Tiene la hipoacutetesis de que varios factores pueden ser uacutetiles para su pronoacutestico Los datos de es-tos factores y el nuacutemero de solicitudes urgentes de devolucioacuten de impuestos de antildeos pasados son

Y X 2 Nuacutemero de

Poblacioacuten solicitudesresidente X 3 de devolucioacuten

X 1 en un radio Ingreso urgentesIacutendice de una milla promedio (1 de marzo

econoacutemico desde la oficina en Ithaca a 15 de abril)

99 10188 21465 2306106 8566 22228 1266100 10557 27665 1422129 10219 25200 1721179 9662 26300 2544

a) Use el siguiente resultado de Minitab para determinar la ecuacioacuten de regresioacuten maacutes adecuada para es-

tos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1556

13-15 Dado el siguiente conjunto de datos utilice el paquete de software que tenga a su disposicioacuten patrar la ecuacioacuten de regresioacuten de mejor ajuste y responda a lo siguientea) iquestCuaacutel es la ecuacioacuten de regresioacutenb) iquestCuaacutel es el error estaacutendar de la estimacioacutenc) iquestCuaacutel es el valor de R2 para esta regresioacutend) Deacute un intervalo de confianza para la estimacioacuten del 95 para el valor Y cuando los valores X

y X 4 son 524 416 358 y 3 respectivamente

X 1 X 2 X 3 X 4 Y

214 629 219 Ϫ2 228

517 407 429 5 937418 818 698 2 649

118 410 909 Ϫ4 192

716 226 129 8 558

919 615 309 1 231

Aplicaciones

1316 Las estaciones de policiacutea en Estados Unidos estaacuten interesadas en predecir el nuacutemero de arrestodos que deberaacuten procesar cada mes para programar mejor a los empleados de oficina En los daricos el nuacutemero promedio de arrestos (Y ) cada mes tiene influencia del nuacutemero de oficiales en

policiaca ( X 1) la poblacioacuten de la ciudad en miles ( X 2) y el porcentaje de personas desempleadasdad en miles ( X 3) Los datos de estos factores en 15 ciudades se presentan en la tablaa) Utilice el paquete de software que tenga disponible para determinar la ecuacioacuten de regresioacuten

jor se ajuste a estos datosb) iquestQueacute porcentaje de la variacioacuten total en el nuacutemero de arrestos (Y ) explica esta ecuacioacutenc) El departamento de policiacutea de ChapelBoro desea pronosticar el nuacutemero de arrestos mensua

pelBoro tiene una poblacioacuten de 75000 habitantes 82 elementos en su fuerza policiaca y utaje de desempleo del 105 iquestCuaacutentos arrestos pronostica para cada mes

Nuacutemero promedio Nuacutemero de oficiales Tamantildeo de la ciudad (X 2) Porcende arrestos mensuales (Y ) en la fuerza (X 1) en miles de habitantes desemp

3906 68 816 4

5043 94 751 3

6284 125 973 5

7456 175 1235 8

5852 113 1184 11

4503 82 654 9

3278 46 616 12

2605 32 543 18

4775 89 974 4

3898 67 824 6

3124 47 564 8

3675 59 713 7

3744 61 674 9

4946 87 963 11

4875 92 864 4

13-17 Estamos intentando predecir la demanda anual (DEMAND) de cierto producto utilizando las svariables independientes

PRECIO ϭ precio del producto (en doacutelares)

INGRESO ϭ ingreso del consumidor (en doacutelares)

SUB ϭ precio de un bien sustituto (en doacutelares)

( Nota Un bien sustituto es aquel que puede suplir a otro bien Por ejemplo la margarina es untituto de la mantequilla)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1656

Se recolectaron datos correspondientes al periodo 1982-1996

Antildeo Demanda Precio ($) Ingreso ($) Sub ($)

1982 40 9 400 101983 45 8 500 141984 50 9 600 121985 55 8 700 131986 60 7 800 111987 70 6 900 151988 65 6 1000 161989 65 8 1100 17

1990 75 5 1200 221991 75 5 1300 191992 80 5 1400 201993 100 3 1500 231994 90 4 1600 181995 95 3 1700 241996 85 4 1800 21

a) Utilice el paquete de software que tenga disponible para encontrar la ecuacioacuten de regresioacuten ajuste para estos datos

b) iquestSon los signos (ϩ o Ϫ) de los coeficientes de regresioacuten de las variables independientes los qperan Deacute una explicacioacuten breve ( Nota Eacutesta no es una pregunta estadiacutestica soacutelo necesita pesignifican los coeficientes de regresioacuten)

c) Establezca e interprete el coeficiente de determinacioacuten muacuteltiple del problemad) Establezca e interprete el error estaacutendar de la estimacioacuten para el problemae) Seguacuten la ecuacioacuten de regresioacuten obtenida iquestqueacute valor de DEMAND predeciriacutea si el precio de

ductos fue $6 el ingreso del consumidor $1200 y el precio del bien sustituto $17 13-18 Bill Buxton profesor de estadiacutestica de una prominente escuela de administracioacuten tiene un prof

tereacutes en los factores que afectan el desempentildeo de los estudiantes en los exaacutemenes El examen psemestre anterior tuvo una distribucioacuten de calificaciones amplia pero Bill tiene la certeza de qfactores explican esa distribucioacuten permite a sus estudiantes que estudien en tantos libros comoca el coeficiente de inteligencia de los estudiantes variacutea tienen distintas edades y difieren losque dedican a estudiar Con el propoacutesito de desarrollar una foacutermula de prediccioacuten para las califde los exaacutemenes Bill pidioacute a cada estudiante que respondiera al final del examen preguntas refe

tiempo de estudio y nuacutemero de libros utilizados Los registros que teniacutea Bill ya incluiacutean el coefiinteligencia y la edad de modo que reunioacute los datos del grupo y corrioacute la regresioacuten muacuteltiple deLa salida de la corrida de Bill fue la siguiente

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t Con s t a nt e minus49 948 41 55 minus1 20 0HORAS 1 06931 0 98163 1 09 0CI 1 36460 0 37627 3 63 0LI BROS 2 03982 1 50799 1 35 0EDAD minus1 79890 0 67332 minus2 67 0

s = 11 657 R- s q = 76 7

a) iquestCuaacutel es la ecuacioacuten de regresioacuten de mejor ajuste para estos datos

b) iquestQueacute porcentaje de la variacioacuten en las calificaciones se explica con esta ecuacioacutenc) iquestQueacute calificacioacuten esperariacutea usted para un estudiante de 21 antildeos de edad con un coeficiente gencia (CI) de 113 que estudioacute durante cinco horas y utilizoacute tres libros diferentes

13-19 La compantildeiacutea de tiendas de abarrotes Twenty-Two estaacute planeando expandir su cadena Como ayudleccionar los lugares donde abriraacute las nuevas tiendas recolectoacute datos de las ventas semanales de casus 23 tiendas Para explicar la variabilidad de las ventas semanales tambieacuten reunioacute informacioacutencribe cuatro variables que se cree estaacuten relacionadas con las ventas Las variables se definen como

VENTAS ϭ ventas semanales promedio en cada tienda en miles de doacutelares

AUTOS ϭ volumen promedio de traacutensito de automoacuteviles por semana en miles de autos

ENTRADA ϭ facilidad de entradasalida medida en una escala de 1 a 100

INGANUAL ϭ ingreso anual promedio por familia en el aacuterea en miles de doacutelares

DISTANCIA ϭ distancia en millas desde la tienda al supermercado maacutes cercano

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1756

Los datos se analizaron con Minitab y la salida es la siguiente

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t Cons t a nt e 175 37 92 62 1 89 0 0AUTOS - 0 028 0 315 minus0 09 0 9ENTRADA 3 775 1 272 2 97 0 0I NGANUAL 1 990 4 510 0 44 0 6DI STANCI A 212 41 28 090 7 56 0 0

s = 85 587 R- s q = 95 8

a) iquestCuaacutel es la ecuacioacuten de regresioacuten de mejor ajuste dada por Minitab

b) iquestCuaacutel es el error estaacutendar de la estimacioacuten para esta ecuacioacutenc) iquestQueacute fraccioacuten de la variacioacuten en las ventas se explica con esta regresioacutend) iquestQueacute ventas predeciriacutea para una tienda localizada en un vecindario que tuvo un ingreso anu

milia de $20000 estaba a 2 millas del supermercado maacutes cercano se encontraba en una calvolumen promedio semanal de traacutensito de 100000 autos y con una facilidad de entrada de

13-20 Rick Blackburn estaacute pensando en vender su casa Con el fin de decidir el precio que pediraacute poreunido datos de 12 ventas recientes Registroacute el precio de venta (en miles de doacutelares) el nuacutemercuadrados de construccioacuten (en cientos de pies cuadrados) el nuacutemero de pisos el nuacutemero de bantiguumledad de la casa (en antildeos)

Precio de venta Pies cuad Pisos Bantildeos Antiguumledad

4965 89 1 10 2

6795 95 1 10 68115 126 2 15 11

8160 129 2 15 8

9150 190 2 10 22

9525 176 1 10 17

10035 200 2 15 12

10425 206 2 15 11

11265 205 1 20 9

14970 251 2 20 8

16065 227 2 20 18

23250 408 3 40 12

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de

de mejor ajuste para los datosb) iquestCuaacutel es el valor de R2 para esta ecuacioacutenc) Si la casa de Rick tiene 1800 pies cuadrados (ϭ 180 cientos de pies cuadrados) un piso

y seis antildeos de antiguumledad iquestqueacute precio de venta puede esperar Rick 13-21 La Allegheny Steel Corporation ha estado buscando los factores que influyen en la cantidad de

millones de toneladas) que puede vender cada antildeo La administracioacuten sospecha que los siguientfactores principales la tasa anual de inflacioacuten del paiacutes el precio promedio por tonelada del acetado que acota los precios (en doacutelares) de Allegheny y el nuacutemero de automoacuteviles (en millonesfabricantes de autos de Estados Unidos planean producir ese antildeo Se recolectaron los datos de losiete antildeos

Y X 2 X 3

Millones X 1 Cota de Nuacutemero

de tons Tasa de importa- deAntildeo vendidas inflacioacuten ciones automoacuteviles

1993 42 31 310 62

1992 31 39 500 51

1991 40 75 220 57

1990 47 107 450 71

1989 43 155 435 65

1988 37 130 260 61

1987 35 110 305 59

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1856

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de regresioacutende mejor ajuste para los datos

b) iquestQueacute porcentaje de la variacioacuten total de la cantidad de acero vendido (en millones de toneladas) porAllegheny cada antildeo explica esta ecuacioacuten

c) iquestCuaacutentas toneladas de acero deberaacute esperar Allegheny vender en un antildeo en el que la tasa de inflacioacutenes 71 los fabricantes de automoacuteviles norteamericanos planean producir 60 millones de autos y la co-ta promedio del acero importado por tonelada es $350

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-3 De la salida del paquete de software se obtienen los siguientes resultadosa) Y ˆ ϭ Ϫ1275 ϩ 17059 X 1 ϩ 05406 X 2 Ϫ 01743 X 3b) R

2ϭ 872 el modelo explica el 872 de la variacioacuten total en Y

c) Y ˆ ϭ Ϫ1275 ϩ 17059(169) ϩ 05406(10212) Ϫ 01743(26925) ϭ 2436 reembolsos de impuestos

134 Inferencias sobre paraacutemetrosde poblacioacuten

En el capiacutetulo 12 se vio que la recta de regresioacuten de la muestra Y ˆ ϭ a ϩ bX (ecuacioacuten 12-3) esti-maba la recta de regresioacuten de la poblacioacuten Y ϭ A ϩ BX (ecuacioacuten 12-13) La razoacuten por la cual soacute-lo podiacuteamos estimar la recta de regresioacuten de poblacioacuten y no determinarla con exactitud era que los

puntos no caen exactamente en la recta de regresioacuten de la poblacioacuten Debido a las variaciones alea-torias los puntos satisfaciacutean Y ϭ A ϩ BX ϩ e (ecuacioacuten 12-13a) maacutes que a Y ϭ A ϩ BX

En la regresioacuten muacuteltiple se tiene justo la misma situacioacuten Nuestro plano de regresioacuten estimado

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k [13-5]

es una estimacioacuten de un plano de regresioacuten de poblacioacuten verdadero pero desconocido de la forma

Plano de regresioacutende la poblacioacuten

De nuevo los puntos individuales normalmente no caen con exactitud en el plano de regresioacuten depoblacioacuten Consideremos el problema del Servicio Interno de Contribuciones para ver por queacute Notodos los pagos a informantes tendraacuten la misma efectividad Algunas horas en computadora podriacuteanutilizarse para recolectar y organizar datos otras para analizar esos datos en busca de errores y frau-des El eacutexito de la computadora en descubrir impuestos no pagados puede depender de cuaacutento tiempose dedique a cada una de estas actividades Por eacutestas y otras razones algunos de los puntos se en-contraraacuten arriba del plano de regresioacuten y algunos estaraacuten abajo de eacuteste En lugar de satisfacer laecuacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

los puntos individuales satisfaraacuten la ecuacioacuten

Las variaciones alea-torias desplazan lospuntos del plano deregresioacuten

Ecuacioacuten de regresioacuten de la poblacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

Plano de regresioacuten de la poblacioacuten maacutes la variacioacuten aleatoria

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e [13-7a]

La cantidad e que aparece en la ecuacioacuten 13-7a es una variacioacuten aleatoria que en promedio es iguala cero La desviacioacuten estaacutendar de las variaciones individuales e y el error estaacutendar de la estima-cioacuten se que estudiamos en la seccioacuten anterior es una estimacioacuten de e

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1956

Como nuestro plano de regresioacuten de la muestra Y ˆ ϭ a ϩ b1X1 ϩ b2 X 2 ϩ ϩ bk X k (ecuaci13-7) estima el plano de regresioacuten de poblacioacuten desconocido Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk

(ecuacioacuten 13-7) deberemos ser capaces de usarlo para hacer inferencias sobre el plano de regreside la poblacioacuten En esta seccioacuten haremos inferencias acerca de las pendientes ( B1 B2 Bk ) deecuacioacuten de regresioacuten ldquoverdaderardquo (la que se aplica a la poblacioacuten completa) basadas en las pendietes (b1 b2 bk ) de la ecuacioacuten de regresioacuten estimada a partir de la muestra de datos

Inferencias acerca de una pendiente individual B i El plano de regresioacuten se deriva de una muestra y no de la poblacioacuten completa Como resultado

podemos esperar que la ecuacioacuten de regresioacuten verdadera Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k que se aplica a la poblacioacuten completa) sea exactamente igual que la ecuacioacuten estimada a partir observaciones de la muestra Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k Sin embargo podemos utilizarvalor de bi una de las pendientes que calculamos a partir de la muestra para probar hipoacutetesis acca del valor de Bi una de las pendientes del plano de regresioacuten para la poblacioacuten completa

El procedimiento para probar una hipoacutetesis respecto a Bi es parecido al procedimiento analizaen los capiacutetulos 8 y 9 sobre pruebas de hipoacutetesis Para entender este proceso regresemos al probma que relaciona los impuestos no pagados descubiertos con las horas de trabajo en auditoriacuteas campo horas en computadora y recompensas a informantes En la paacutegina 729 sentildealamos que b10597 El primer paso consiste en encontrar un valor para B1 y compararlo con b1 ϭ 0597

Suponga que durante un periodo largo la pendiente de la relacioacuten entre Y y X 1 fue 0400 Paprobar si todaviacutea es vaacutelida podriacuteamos definir las hipoacutetesis como

H0 B1 ϭ 0400 larr Hipoacutetesis nula

H1 B1 0400 larr Hipoacutetesis alternativa

De hecho realizamos la prueba para saber si los datos actuales indican que B1 ha cambiado su vahistoacuterico de 0400

Para encontrar el estadiacutestico de prueba para B1 es necesario hallar primero el error estaacutendar d

coeficiente de regresioacuten El coeficiente de regresioacuten con el que estamos trabajando es b1 de moque el error estaacutendar de este coeficiente se representa con sb1

Resulta demasiado difiacutecil calcular sb1 a mano pero por fortuna Minitab calcula los errores estaacutedar de todos los coeficientes de regresioacuten Por comodidad repetimos la figura 13-2 Los errores taacutendar de los coeficientes se dan en la columna DesvEst de la salida de Minitab

En el cuadro de salida vemos que sb1

es 00811 (Similarmente si deseamos probar una hipoacutesis acerca de B2 vemos que el error estaacutendar apropiado que debemos utilizar es sb2 ϭ 00841) Uvez que encontramos sb1 en la salida de Minitab podemos usar la ecuacioacuten 13-8 para estandarizarpendiente de nuestra ecuacioacuten de regresioacuten ajustada

Estandarizacioacutendel coeficiente deregresioacuten

Error estaacutendar delcoeficientede regresioacuten

Prueba de unahipoacutetesis acerca de B i

Diferencia entre la

ecuacioacuten de regre-sioacuten verdadera y unaestimada a partir delas observacionesde la muestra

Coeficiente de regresioacuten estandarizado

t ϭ [13-8bi ndash Bi0ᎏ

sbi

donde

bull biϭ pendiente de la regresioacuten ajustada

bull Bi0 ϭ pendiente real hipoteacutetica para la poblacioacutenbull sbi ϭ error estaacutendar del coeficiente de regresioacuten

iquestPor queacute utilizamos t para denotar el estadiacutestico estandarizado Recuerde que en la regresioacuten siple utilizamos a y b en la ecuacioacuten 12-7 para calcular se y que se estimaba e la desviacioacuten estaacutedar de las variaciones de los datos (ecuacioacuten 12-13a) Entonces utilizamos se en la ecuacioacuten 12-para encontrar sb el error estaacutendar del coeficiente de regresioacuten que corresponde a la pendiente E

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2056

pezamos con n puntos y los usamos para estimar los dos coeficientes a y b Luego basamtras pruebas en la distribucioacuten t con n Ϫ 2 grados de libertad

De manera similar en la regresioacuten muacuteltiple tambieacuten empezamos con n puntos pero lospara estimar k ϩ 1 coeficientes la ordenada a y k pendientes b1 b2 bk Despueacutes estcientes se usan en la ecuacioacuten 13-6 para calcular se que de nuevo es una estimacioacuten de eviacioacuten estaacutendar de las variaciones de los datos (ecuacioacuten 13-7a) Luego se utiliza se (en ucioacuten que estaacute maacutes allaacute del alcance de este libro) para encontrar s

bi Debido a lo anterior

nuestras pruebas de hipoacutetesis en la distribucioacuten t con n Ϫ k Ϫ 1 (ϭ n Ϫ ( k ϩ l)) grados de En nuestro ejemplo el valor estandarizado del coeficiente de regresioacuten es

t ϭ

ϭ

ϭ 2432 larr Coeficiente de regresioacuten estandarizado

Suponga que estamos interesados en probar nuestras hipoacutetesis al nivel de significancia

Como tenemos 10 observaciones en la muestra y tres variables independientes sabemos n Ϫ k Ϫ 1 o 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad Buscamos en la tabla 2 del apeacutendice en lana de 10 y el rengloacuten de 6 grados de libertad Ahiacute vemos que el valor apropiado de t es 19mo nos preocupa si b1 (la pendiente del plano de regresioacuten de la muestra) es significativamferente de B1 (la pendiente hipoteacutetica del plano de regresioacuten de la poblacioacuten) eacutesta es una pdos colas y los valores criacuteticos son Ϯ1943 El coeficiente de regresioacuten estandarizado es 2se encuentra fuera de la regioacuten de aceptacioacuten de nuestra prueba de hipoacutetesis Por consiguichazamos la hipoacutetesis nula de que B1 todaviacutea es igual a 0400 En otras palabras existe unacia suficientemente grande entre b1 y 0400 para concluir que B1 ha cambiado respecto a histoacuterico Por esto sentimos que cada 100 horas adicionales de trabajo en auditoriacuteas de camaumentan la cantidad de descubrimientos de impuestos no pagados en $400000 como lo hel pasado

Ademaacutes de la prueba de hipoacutetesis podemos construir un intervalo de confianza para cude los valores de Bi Del mismo modo que bi es una estimacioacuten puntual de Bi estos intervalofianza son estimaciones de intervalo de Bi Para ilustrar el proceso de construccioacuten de interconfianza encontremos un intervalo de confianza del 95 para B3 en el ejemplo del IRS Lrelevantes son

b3 ϭ 0405 de la figura 13-2sb3 ϭ 00422

t ϭ 2447 larr Nivel de significancia del 5 y 6 grados de libertad

Intervalo deconfianza para B i

Realizacioacuten de la

prueba de hipoacutetesis

0597 ndash 0400ᎏᎏ

0081

b1 ndash B10ᎏ

sb1

Anaacute l i s i s de r e gr e s i oacutenLa ec uaci oacuten de r egr es i oacuten esDESCUBRE = - 45 0 + 0 597 AUDI TORIacute A + 1 18 COMPUTADORA + 0 405 RECOMPENSA

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 45 796 4 878 - 9 39 0 000AUDI TORIacute A 0 50697 0 08112 7 36 0 000COMPUTADORA 1 17684 0 08407 14 00 0 000RECOMPENSAS 0 40511 0 04223 9 59 0 000

s = 0 2861 R- s q = 98 3

FIGURA 13-2

Salida de Minitab(figura repetida)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2156

Con esta informacioacuten podemos calcular el intervalo de confianza de la siguiente manera

b3 ϩ t (sb3) ϭ 0405 ϩ 2447(00422)

ϭ 0508 larr Liacutemite superior

b3 Ϫ t (sb3) ϭ 0405 Ϫ 2447(00422)

ϭ 0302 larr Liacutemite inferior

Vemos que podemos tener una seguridad del 95 de que cada $1000 adicionales pagados a los formantes aumenta el descubrimiento de impuestos no pagados en una cantidad entre $302000$508000

A menudo estaremos interesados en preguntas del tipo iquesten realidad Y depende de X i Por ejeplo podriacuteamos preguntar si descubrir impuestos no pagados en realidad depende de las horas encomputadora Con frecuencia esta pregunta se plantea como iquestes X i una variable explicativa sigficativa de Y Si piensa un poco maacutes se convenceraacute de que si Bi 0 Y depende de las X i (esto esvariacutea cuando X i variacutea) y no depende de X i si Bi ϭ 0

Vemos que nuestra pregunta conduce a establecer hipoacutetesis de la forma

H0 Bi ϭ 0 larr Hipoacutetesis nula X i no es una variable explicativa significativa

H1 Bi 0 larr Hipoacutetesis alternativa X i es una variable explicativa significativa

Podemos probar estas hipoacutetesis utilizando la ecuacioacuten 13-8 del mismo modo que cuando probamnuestras hipoacutetesis acerca de si B1 todaviacutea era igual a 0400 Sin embargo existe una forma maacutes faacutede hacerlo usando la columna de la figura 13-2 de ldquocociente- t rdquo Observemos de nuevo la ecuaci13-8

t ϭ [13-

Como nuestro valor hipoteacutetico de Bi es cero el valor estandarizado del coeficiente de regresioacutedenotado por t o se convierte en

t o ϭ

El valor de t o se conoce como valor t ldquocalculadordquo Eacuteste es el nuacutemero que aparece en la columna equetada como ldquocociente-t rdquo en la figura 13-2 Denotemos por t c el valor t ldquocriacuteticordquo que buscamos

la tabla 2 del apeacutendice Entonces como la prueba para determinar si X i es una variable explicatisignificativa es una prueba de dos colas soacutelo necesitamos verificar si Ϫt c Յ t o Յ t c

Uso de valores t

calculados en lasalida de Minitab

biᎏ

sbi

bi ndash Bi0ᎏ

sbi

iquestEs significativa unavariable explicativa

Prueba para determinar si una variable es o no significativa

Ϫt c Յ t o Յ t c [13-9

donde

bull t c ϭ valor t adecuado (con n Ϫ k Ϫ 1 grados de libertad) para el nivel de significancia deprueba

bull t o ϭ bi sbi ϭ valor t observado (o calculado) obtenido con el paquete de software

Si t o

cae entre Ϫt c

y t c aceptamos H0 y llegamos a la conclusioacuten de que X

ino es una variable exp

cativa significativa En cualquier otro caso rechazamos H0 y concluimos que X i es una variable eplicativa significativa

Probemos al nivel de significancia de 001 si las horas en computadora constituyen una variabexplicativa significativa para los impuestos no pagados descubiertos De la tabla 2 del apeacutendice cn Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad y ϭ 001 vemos que t c ϭ 3707 De la figura 13tenemos que t o = 1400 Como t o Ͼ t c concluimos que el tiempo en computadora es una variab

Prueba de lasignificancia de lavariable horas decomputadora en elproblema del IRS

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2256

explicativa significativa De hecho al observar los valores t calculados para las otras dos vindependientes (tiempo de auditoriacuteas de campo t o ϭ 736 y recompensa a informantes t ovemos que tambieacuten son variables explicativas significativas

Podemos tambieacuten utilizar la columna de ldquoprdquo para probar si X i es una variable explicativacativa De hecho utilizando esa informacioacuten ni siquiera necesitamos usar la tabla 2 del aLos elementos de esta columna son los valores prob para las hipoacutetesis

H0 Biϭ 0

H1 Bi 0

Recuerde del anaacutelisis hecho en el capiacutetulo 9 que estos valores prob constituyen la probabque cada bi esteacute tan lejos de cero como (o maacutes) el valor observado obtenido de la regresioacutenverdadera Como se ilustra en la figura 13-3 solamente necesitamos comparar estos valocon el nivel de significancia de la prueba para determinar si X i es o no una variable expsignificativa para Y

Probar la significancia de una variable explicativa es siempre una prueba de dos colas Lble independiente X i es una variable explicativa significativa si bi es significativamente dife

cero es decir si t o es un nuacutemero grande positivo o negativoPara el ejemplo del IRS repetimos las pruebas con ϭ 001 Para cada una de las tres v

independientes p es menor que 001 de forma que podemos concluir que cada una de ellanificativa

Inferencias acerca de la regresioacuten como un todo

(usando una prueba F )

Suponga que cubre con papel un tablero para dardos y lanza varios dardos sobre eacutel Despueacuteberlo hecho tendraacute algo muy parecido a un diagrama de dispersioacuten Suponga entonces quuna recta de regresioacuten a este conjunto de ldquopuntos observadosrdquo y calcula r

2 Debido a que lofueron lanzados aleatoriamente usted espera obtener un valor bajo de r

2 puesto que en esten realidad no explica a Y Sin embargo si hace esto muchas veces ocasionalmente observalor alto de r

2 por pura casualidadDada cualquier regresioacuten simple (o muacuteltiple) es natural preguntarse si el valor de r2 (

realmente indica que las variables independientes explican a Y o si esto sucede por cas

A menudo esta interrogante se plantea de la siguiente manera iquestla regresioacuten como un todo ficativa En la uacuteltima seccioacuten vimos coacutemo decidir si una X i individual es una variable exp

Significancia de laregresioacuten comoun todo

FIGURA 13-3

Uso de ldquoprdquo paradeterminar si X i esuna variable expli-cativa significativa

Regioacuten de aceptacioacuten Regioacuten de aceptacioacuten

2 del aacuterea

2 del aacuterea

2 del aacuterea

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

ndasht c

ndasht o

t o

t c

0

(a) p es mayor que X

i no es una variable

explicativa significativa

(b) p es menor que X

i es una variable

explicativa significativa

ndasht o

ndasht c

t c

0

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2356

significativa ahora veremos coacutemo decidir si todas las X i tomadas en conjunto explican significavamente la variabilidad observada de Y Nuestras hipoacutetesis son

H0 B1 ϭ B2 ϭ ϭ Bk ϭ 0 larr Hipoacutetesis nula Y no depende de las X i

H1 por lo menos una Bi 0 larr Hipoacutetesis alternativa Y depende de al menos una de las X i

Cuando analizamos r 2 en el capiacutetulo 12 consideramos la variacioacuten total en Y sum(Y Ϫ Y ෆ )2 la p

te de dicha variacioacuten que explica la regresioacuten sum(Y ˆ Ϫ Y ෆ )2 y la parte no explicada de la variacioacutensum(Y Ϫ Y ˆ )2 La figura 13-4 es un duplicado de la figura 12-15 Sirve como repaso de la relacioacuten etre la desviacioacuten total la desviacioacuten explicada y la desviacioacuten no explicada para un solo dato en uregresioacuten simple Aunque no podamos dibujar una figura similar para una regresioacuten muacuteltiple coceptualmente estamos haciendo lo mismo

Al analizar la variacioacuten en Y fijamos nuestra atencioacuten en tres teacuterminos diferentes cada uno de cuales es una suma de cuadrados Los denotamos con

Suma de cuadradosy sus grados delibertad

Anaacutelisis de lavariacioacuten de losvalores Y

FIGURA 13-4

Desviacioacuten totaldesviacioacutenexplicada ydesviacioacuten noexplicada paraun valor observadode Y

Y

X

Un valor observado de lavariable dependiente (Y )

R e c t a d

e r e g r e s

i oacute n

Desviacioacuten no explicada de esta Y respectoa su media Y

(Y ndash Y )^

Desviacioacuten explicada deesta Y respecto a su media Y

(Y ndash Y )^Y

Valor estimado de esta Y

a partir de la recta de regresioacuten (Y )^

Desviacioacuten total de esta Y

respecto a su media Y

(Y ndash Y )

Tres sumas de cuadrados

SCT ϭ suma de cuadrados total (es decir la parte explicada) ϭ sum(Y Ϫ Y ෆ )2

SCR ϭ suma de cuadrados de la regresioacuten (es decir la parte explicada) ϭ sum(Y ˆ Ϫ Y ෆ )2 [13-10

SCE ϭ suma de cuadrados del error (es decir la parte no explicada) ϭ sum(Y Ϫ Y ˆ )2

Estaacuten relacionadas por la ecuacioacuten

que dice que la variacioacuten total en Y puede dividirse en dos partes la parte explicada y la no explicaCada una de estas sumas de cuadrados tiene un nuacutemero asociado de grados de libertad SCT t

ne n Ϫ 1 grados de libertad (n observaciones menos un grado de libertad debido a que la media la muestra estaacute fija) SCR tiene k grados de libertad porque existen k variables independientes qse utilizaron para explicar Y Finalmente SCE tiene n Ϫ k Ϫ 1 grados de libertad porque utilizamnuestras n observaciones para estimar k ϩ 1 constantes a b1 b2 bk Si la hipoacutetesis nula es ci

ta el cociente

Descomposicioacuten de la variacioacuten total de Y

SCT ϭ SCR ϩ SCE [13-1

Cociente F

F ϭ [13-12SCR k ᎏᎏ

SCE(n ndash k ndash 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2456

tiene una distribucioacuten F con k grados de libertad en el numerador y n Ϫ k Ϫ 1 grados de libel denominador Si la hipoacutetesis nula es falsa entonces el cociente tiende a ser maacutes grande qula hipoacutetesis nula es verdadera De modo que si el cociente F es demasiado grande (seguacuten lo na el nivel de significancia de la prueba y el valor apropiado de la tabla 6 del apeacutendice) rechH0 y concluimos que la regresioacuten como un todo es significativa

La figura 13-5 presenta la salida de Minitab para el problema del IRS Esta parte del rincluye los cocientes F calculados para la regresioacuten en ocasiones llamado anaacutelisis de v

(ANOVA) para la regresioacuten Probablemente se pregunte si esto tiene algo que ver con el anaacutelisrianza que estudiamos en el capiacutetulo 11 La respuesta es siacute Aunque no lo hicimos es posibletrar que el anaacutelisis de varianza visto en el capiacutetulo 11 tambieacuten contempla la variacioacuten total las observaciones alrededor de la gran media y la divide en dos partes una explicada por lascias entre los distintos grupos (que corresponde a lo que llamamos varianza entre columnas)

no explicada por dichas diferencias (que corresponde a la varianza dentro de columnas) Estcisamente anaacutelogo a lo que acabamos de hacer en la ecuacioacuten 13-11Para el problema del IRS vemos que SCR ϭ 29109 (con k ϭ 3 grados de libertad) SCE

(con n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad) y que

F ϭ ϭ ϭ 11833

Los elementos en la columna ldquoMCrdquo son justo las sumas de cuadrados divididas entre sus glibertad Para 3 grados de libertad en el numerador y 6 en el denominador la tabla 6 del apeacutence que 978 es el liacutemite superior de la regioacuten de aceptacioacuten para un nivel de significancia El valor calculado de F 11833 estaacute muy por arriba de 978 de manera que se ve que la r

como un todo es altamente significativa Se puede llegar a la misma conclusioacuten si se observresultado del programa dice que ldquo prdquo es 0000 Debido a que este valor prob es menor que elsignificancia ϭ 001 se concluye que la regresioacuten completa es significativa De esta mapuede usar la p de ANOVA como prueba sin tener que utilizar la tabla 6 del apeacutendice para bvalor criacutetico de F Esto es anaacutelogo a la manera en que se usaron los valores de p en la figura ra probar la significancia de las variables explicativas individuales

Multicolinealidad en la regresioacuten muacuteltiple

En el anaacutelisis de regresioacuten muacuteltiple los coeficientes de regresioacuten a menudo se vuelven

confiables conforme aumenta el grado de correlacioacuten entre las variables independie

existe un alto nivel de correlacioacuten entre algunas de las variables independientes nos enfrenun problema que los estadiacutesticos llaman multicolinealidad

La multicolinealidad puede presentarse si deseamos estimar la recuperacioacuten de las ventaempresa y utilizamos tanto el nuacutemero de vendedores empleados como sus salarios totales Cvalores asociados con estas dos variables independientes tienen una correlacioacuten alta neceusar soacutelo un conjunto de ellos para realizar nuestra estimacioacuten De hecho al agregar una segriable que estaacute correlacionada con la primera se distorsionan los valores de los coeficientgresioacuten Sin embargo a menudo podemos predecir bien Y incluso cuando haya multicoline

Consideremos un ejemplo donde existe multicolinealidad para ver coacutemo afecta a la regresrante los 12 meses pasados el gerente del restaurante Pizza Shack ha estado poniendo unaanuncios en el perioacutedico local Los anuncios se programan y pagan el mes anterior a que ap

Un ejemplo demulticolinealidad

Definicioacuten y efecto dela multicolinealidad

9703ᎏ

0082

29109 3ᎏ

0491 6Prueba de lasignificancia de laregresioacuten en elproblema del Serviciode Contribuciones

Anaacutelisis devarianza parala regresioacuten

Prueba F de laregresioacuten como

un todo

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 29 1088 9 7029 118 52 0Er r or 6 0 4912 0 0819Tot al 9 29 6000

FIGURA 13-5Salida de Minitabanaacutelisis devarianza

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2556

Cada anuncio contiene un cupoacuten que permite llevarse dos pizzas pagando solamente la de mcio El gerente recolectoacute los datos de la tabla 13-4 y le gustariacutea utilizarlos para predecir las vpizzas

En las figuras 13-6 y 13-7 se dieron los resultados de Minitab para las regresiones respelas ventas totales sobre el nuacutemero de anuncios y sobre el costo

Para la regresioacuten sobre el nuacutemero de anuncios tenemos que el valor t observado es 395grados de libertad y un nivel de significancia de ϭ 001 se encontroacute que el valor t criacuteticdo de la tabla 2 del apeacutendice) es 3169 Como t o Ͼ t c (o de manera equivalente como p es m001) concluimos que el nuacutemero de anuncios es una variable explicativa altamente signifilas ventas totales Note tambieacuten que r 2 ϭ 610 de modo que el nuacutemero de anuncios explximadamente el 61 de la variacioacuten en las ventas de pizzas

Para la regresioacuten sobre el costo de los anuncios el valor t observado es 454 de modo qude los anuncios es una variable explicativa de las ventas totales todaviacutea maacutes significativa que ro de anuncios (para los que el valor t observado fue soacutelo 395) En esta regresioacuten r 2 ϭ 673

el costo de los anuncios explica aproximadamente el 67 de la variacioacuten de las ventas de pizComo ambas variables explicativas son altamente significativas por siacute mismas intentam

zar ambas en una regresioacuten muacuteltiple El resultado se presenta en la figura 13-8La regresioacuten muacuteltiple es altamente significativa como un todo ya que la p de ANOVA e

Uso de ambas varia-bles explicativas enuna regresioacuten muacuteltiple

Dos regresionessimples

Datos de ventas y anun-cios para el restaurantePizza Shack

Tabla 13-4 X 1 X 2 Y

Nuacutemero Costo de anuncios Venta tode anuncios publicados de pizz

Mes publicados (cientos de doacutelares) (miles de d

Mayo 12 139 436

Junio 11 120 380

Julio 9 93 301

Agosto 7 97 353

Septiembre 12 123 464

Octubre 8 114 342

Noviembre 6 93 302

Diciembre 13 143 407

Enero 8 102 385

Febrero 6 84 226

Marzo 8 112 376

Abril 10 111 352

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esVENTAS = 16 9 + 2 08 ANUNCI OS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 16 937 4 982 3 40 0 007ANUNCI OS 2 0832 0 5271 3 95 0 003

s = 4 206 R- s q = 61 0

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 1 276 31 276 31 15 62 Er r or 10 176 88 17 69Tot a l 11 453 19

Figura 13-6

Regresioacuten de lasventas sobre elnuacutemero deanuncios conMinitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2656

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2756

gar el nuacutemero de anuncios como segunda variable explicativa ademaacutes del costo de los anuncios eplica nada maacutes alrededor del 1 adicional de la variacioacuten de las ventas totales

En este punto es justo preguntarse iquestqueacute variable realmente explica la variacioacuten de las ventotales en la regresioacuten muacuteltiple La respuesta es que ambas la explican pero no podemos separ

sus contribuciones individuales debido a que estaacuten altamente correlacionadas entre siacute E

consecuencia sus coeficientes en la regresioacuten muacuteltiple tienen errores estaacutendar altos valore

calculados relativamente bajos y valores prob Ͼ | t | relativamente altos

iquestDe queacute manera nos afecta esta multicolinealidad Todaviacutea podemos hacer predicciones relativmente precisas cuando se encuentra presente note que para la regresioacuten muacuteltiple (la salida se dala figura 13-8) el error estaacutendar de la estimacioacuten que determina el ancho de los intervalos de co

fianza para las predicciones es 3989 mientras que para la regresioacuten simple con el costo de los anucios como variable explicativa (salida en la figura 13-7) tenemos se ϭ 3849 Lo que no podemhacer es predecir con mucha precisioacuten coacutemo cambiaraacuten las ventas si aumentamos en uno el nuacutemede anuncios La regresioacuten muacuteltiple dice que b1 ϭ 0625 (esto es cada anuncio aumenta las ventotales de pizzas alrededor de $625) pero el error estaacutendar de este coeficiente es 112 (es decir apximadamente $1120)

Las contribucionesindividuales nopueden separarse

Ejercicios 134

Ejercicios de autoevaluacioacuten

EA 13-4 Edith Pratt es una ocupada ejecutiva de una compantildeiacutea de transporte de carga a nivel nacional y va tara una junta porque no encuentra la salida de la regresioacuten muacuteltiple elaborada por un asistente Si la regsioacuten total es significativa al nivel 005 ella desea usar las salida de computadora como evidencia para fudamentar algunas ideas que expondraacute en la reunioacuten Sin embargo su ayudante estaacute enfermo De hectoda la informacioacuten que tiene de la regresioacuten muacuteltiple es un trozo de papel con los siguientes datos

Regresioacuten paraEdith Pratt

SCR 8724 con gl

SCE con 17 gl

SCT 10236 con 24 gl

Como el papel ni siquiera tiene todos los nuacutemeros Edith ha concluido que no es uacutetil Usted sin embardebe saber maacutes que ella iquestPuede Edith entrar en la junta o debe seguir buscando la salida de computador

EA 13-5 Una pequentildea liacutenea aeacuterea de Nueva Inglaterra realizoacute una encuesta sobre sus 15 terminales y obtuvo losguientes datos para el mes de febrero donde

VENTAS ϭ ingreso total seguacuten el nuacutemero de boletos vendidos (en miles de doacutelares)

PROMOCϭ cantidad gastada en promociones de la liacutenea aeacuterea en el aacuterea (en miles de doacutelares)

COMPET ϭ nuacutemero de liacuteneas aeacutereas que compiten en esa terminal

GRATIS ϭ nuacutemero de pasajeros que vuelan gratis (por diferentes razones)

Sugerencia el concepto de hacer infe-rencias respecto a una regresioacuten muacutelti-ple es justo lo mismo que se hizo en elcapiacutetulo 12 cuando hicimos inferencias

respecto a una recta de regresioacuten excepto que ahora se em-

plean dos o maacutes variables independientes Advertencia lamulticolinealidad es un problema que debe manejarse enla regresioacuten muacuteltiple y es necesario desarrollar una com-prensioacuten con sentido comuacuten Recuerde que todaviacutea puedehacer predicciones precisas cuando estaacute presente Pero re-cuerde tambieacuten que no puede decir con mucha precisioacuten

cuaacutento cambiaraacute la variable dependiente si ldquomanipulardquo lavariables independientes Entonces el objetivo debe seminimizar la multicolinealidad Sugerencia la mejor regresioacuten muacuteltiple es la que explica la relacioacuten entre los datos asentildealar la responsabilidad de la mayor proporcioacuten de la va

riacioacuten en la variable dependiente con el menor nuacutemero dvariables independientes Advertencia no es una buenidea incluir demasiadas variables independientes soacutelo porque cuenta con una computadora y un paquete de softwarpara estadiacutestica

SUGERENCIAS

Y

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2856

Ventas (doacutelares) Promoc (doacutelares) Compet Gratis

793 25 10 3

2001 55 8 6

1632 60 12 9

2001 79 7 16

1460 52 8 15

1777 76 12 9

309 20 12 8

2919 90 5 10

1600 40 8 43394 96 5 16

1596 55 11 7

863 30 12 6

2375 60 6 10

1072 50 10 4

1550 35 10 4

a) Utilice la siguiente salida de Minitab para determinar la ecuacioacuten de regresioacuten que mejor se ara la liacutenea aeacuterea

La ec uaci oacuten de r egr es i oacuten esVENTAS ϭ 172 ϩ 25 9 PROMOVϪ 13 2 COMPET Ϫ 3 04 GRATI S

Pr onos t i cador Coef Des vEs t Coci ent e - t Cons t ant e 172 34 51 38 3 35 0PROMOV 25 950 4 877 5 32 0COMPET - 13 238 3 686 - 3 59 0GRATI S - 3 041 2 342 - 1 30 0

b) iquestLos pasajeros que vuelan gratis ocasionan una disminucioacuten significativa en las ventas Fpruebe las hipoacutetesis apropiadas Use ϭ 005

c) iquestUn incremento de $1000 en las promociones cambia las ventas en $28000 o el cambio ecativamente diferente de $28000 Formule y pruebe las hipoacutetesis adecuadas Use ϭ 010

d) Calcule un intervalo de confianza del 90 para el coeficiente de la pendiente de la COMPET

Aplicaciones

13-22 Mark Lowtown publica el perioacutedico Mosquito Junction Enquirer y tiene problemas para predectidad de papel perioacutedico que necesita imprimir diariamente Eligioacute aleatoriamente 27 diacuteas del arior y registroacute la siguiente informacioacuten

PESO ϭ peso en libras de papel perioacutedico para la edicioacuten de ese diacutea

CLASIFICADOS ϭ nuacutemero de anuncios clasificados

PUBLICIDAD ϭ nuacutemero de anuncios publicitarios

PLANA COMPLETA ϭ nuacutemero de anuncios a una plana

Utilizando Minitab para hacer una regresioacuten de PESO sobre las otras tres variables Mark obtuguiente salida

Pr onos t i cador Coef Des vEs t Coci ent e- t Cons t ant e 1072 95 872 43 1 23 0CLASI FI CADOS 0 251 0 126 1 99 0PUBLI CI DAD 1 250 0 884 1 41 0PLANA COMPLETA 250 66 67 92 3 69 0

a) Mark siempre ha pensado que cada anuncio publicitario utiliza al menos 3 libras de papel iquestsioacuten le da una razoacuten significativa para dudar esto al nivel del 5

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2956

b) De manera similar Mark siempre ha creiacutedo que cada anuncio clasificado utiliza aproximmedia libra de papel iquestTiene ahora Mark una razoacuten significativa para dudar esto al nivel del

c) Mark vende espacios de anuncios de plana completa a los comerciantes locales a $30 la paacutegberaacute pensar en ajustar sus tarifas si el papel perioacutedico le cuesta $009 por libra Suponga costos son despreciables Establezca expliacutecitamente las hipoacutetesis y una conclusioacuten (Sugere

jando todo lo demaacutes constante cada anuncio adicional de plana completa tiene un costo de bras de papel ϫ $009 por libra ϭ $2256 El punto de equilibrio es 333333 libras iquestPor quel coeficiente de pendiente para PLANA COMPLETA es significativamente mayor que Mark no estaacute obteniendo ganancias y debe cambiar sus tarifas)

13-23 Para los datos del ejercicio 13-18 y un nivel de significancia de 010 iquestcuaacuteles variables son sign

mente explicativas de los resultados de los exaacutemenes (Habiacutea 12 estudiantes en la muestra) 13-24 Para los datos del ejercicio 13-18 y la siguiente salida de Minitab del procedimiento de regresiple hecho por Bill

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 3134 42 783 60Er r or 7 951 25 135 89Tot a l 11 4085 67

a) iquestCuaacutel es el valor observado de F b) A un nivel de significancia de 005 iquestcuaacutel es el valor criacutetico de F que se debe utilizar para d

si la regresioacuten como un todo es significativac) Basaacutendose en las respuestas a los incisos a) y b) iquestes la regresioacuten significativa como un tod

13-25 Remiacutetase al ejercicio 13-19 A un nivel de significancia de 001 iquestes la variable DISTANCIA uble explicativa significativa para VENTAS

13-26 Para los datos del ejercicio 13-19 y la siguiente salida adicional de Minitab al correr la regresioacuten

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 2861495 715374 102 39 0Er r or 18 125761 6896 7Tot a l 22 2987256

Al nivel de significancia de 005 iquestes la regresioacuten significativa como un todo

13-27 Henry Lander es el director de produccioacuten de la Alecos Corporation de Caracas Venezuela Hede que le ayude a determinar una foacutermula para predecir el ausentismo de los empacadores de chipoacutetesis es que la temperatura diaria promedio puede explicar el porcentaje de ausentismo Durios meses reuacutene datos ejecuta el procedimiento de regresioacuten simple y encuentra que la tempeplica 66 de la variacioacuten en el ausentismo Pero Henry no estaacute convencido de que eacuteste sea un cador satisfactorio Sugiere que la precipitacioacuten pluvial diaria podriacutea tambieacuten tener algo que vausentismo de modo que registra los datos correspondientes y hace una regresioacuten del ausentismte el tiempo de lluvias y obtiene un valor R2 de 059 ldquoiexclEurekardquo grita usted ldquoiexclLo tengo Con uticador que explica 66 y otro que explica 59 todo lo que tengo que hacer es una regresioacutenutilizando ambos y seguramente tendreacute un pronosticador casi perfectordquo Para su desaacutenimo sin la regresioacuten muacuteltiple tiene una R

2 de soacutelo 68 que es solamente un poco mejor que la variablperatura sola iquestCoacutemo puede explicar esta aparente discrepancia

13-28 Juan Armenlegg administrador de Rockyrsquos Diamond y Jewelry Store estaacute interesado en desamodelo para estimar la demanda del consumidor para su costosa mercanciacutea Como la mayoriacutea de

tes compran diamantes y joyas a creacutedito Juan estaacute seguro de que dos factores que deben influirmanda de los clientes son la tasa real de inflacioacuten anual y la tasa real de intereses sobre preacutestamprincipales bancos del paiacutes Explique algunos problemas que Juan podriacutea encontrar si fuera a dun modelo de regresioacuten basado en estas dos variables de prediccioacuten

13-29 Un nuevo programa de juegos Check That Model pide a los concursantes que especifiquen el nuacutenimo de paraacutemetros que necesitan para determinar si un modelo de regresioacuten muacuteltiple es signifimo un todo para ϭ 001 Usted ganoacute la apuesta con 4 paraacutemetros Use la siguiente informacioacutenterminar si la regresioacuten es significativa

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3056

R 2

ϭ 07452

SCE ϭ 1254

n ϭ 18

Nuacutemero de variables independientes ϭ 3

13-30 La Scottish Turist Agency estaacute interesada en el nuacutemero de turistas que entran al paiacutes cada semanrante la temporada alta Se recolectaron los siguientes datos

Turistas (Y ) ϭ nuacutemero de turistas que entran a Escocia en una semana (en miles)

Cambio (X 1)ϭ nuacutemero de libras escocesas compradas por $1 doacutelar

Precio (X 2) ϭ nuacutemero de libras escocesas cobradas por viaje redondo en camioacuten de Londres a Edimburgo

Promoc (X 3) ϭ cantidad gastada en promocioacuten del paiacutes (en miles de libras escocesas)Temp (X 4) ϭ temperatura media durante la semana en Edimburgo (en grados Celsius)

Turistas (Y ) Cambio (X 1) Precio (X 2) Promoc (X 3) Temp (X 4)

69 061 40 87 154

71 059 40 88 156

68 063 40 85 154

79 061 35 86 153

76 060 35 94 158

82 065 35 99 162

80 058 35 98 164

84 059 35 102 166

97 061 30 114 174

98 062 30 116 172

72 057 40 84 176

67 055 40 86 164

a) Utilice el paquete de software que tenga para determinar la ecuacioacuten de regresioacuten que mejote a los datos de la agencia de turismo

b) iquestEs la tasa de cambio una variable explicativa significativa Establezca y pruebe las hipoacutetesidas a un nivel de significancia de 010

c) Un incremento de 1000 libras en las promociones iquestaumenta el nuacutemero de turistas en maacutesEstablezca y pruebe las hipoacutetesis adecuadas para un nivel de significancia de 005

d) Calcule un intervalo de confianza del 95 para el coeficiente de la pendiente de Temp

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-4 Como SCT ϭ SCR ϩ SCE SCE ϭ SCT Ϫ SCR ϭ 10236 Ϫ 8724 ϭ 1512Como gl SCT ϭ gl SCR ϩ gl SCE gl SCR ϭ gl SCT Ϫ gl SCE ϭ 24 Ϫ 17 ϭ 7

Entonces F ϭ ϭ ϭ 1401

F CRiacuteT ϭ F (7 17 005) ϭ 261Como F OBS gt F CRIacuteT se concluye que la regresioacuten es significativa como un todo Edith debe conticando la salida de computadora de la regresioacuten para usarla en la junta

EA 13-5 De la salida de computadora se obti enen los siguientes resultadosa) VENTAS ϭ 17234 ϩ 25950PROMOC Ϫ13238COMPET Ϫ 3041GRATISb) H0 BGRATIS ϭ 0 H1 BGRATIS Ͻ 0 ϭ 005

Eacutesta es una prueba de una cola y el valor prob en los resultados es para la alternativa de dos c BGRATIS 0 De manera que para esta prueba el valor prob es 02212 ϭ 0111 Ͼ ϭ 00que no se puede rechazar H0 las ventas no disminuyen significativamente cuando aumenta ro de pasajeros que vuelan gratis

c) H0 BPROMOC ϭ 28 H1 BPROMOC 28 ϭ 010

87247ᎏᎏ

151217SCRk ᎏᎏ

SCE(n Ϫ k Ϫ 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3156

El valor observado t de los resultados de regresioacuten es

ϭ ϭ Ϫ0420

Con 11 grados de libertad y ϭ 010 en ambas colas combinadas los valores criacuteticos t parba son Ϯ1796 asiacute el valor observado estaacute dentro de la regioacuten de aceptacioacuten No se rechacambio en VENTAS para un incremento de una unidad ($1000) en PROMOC no es significate diferente de 28 ($28000)

d) Con 11 grados de libertad el valor t para un intervalo del 90 de confianza es 1796 por lo

tervalo esbCOMP Ϯ 1796sbCOMP

ϭ Ϫ13238 Ϯ 1796(3686)

ϭ Ϫ13238 Ϯ 6620 ϭ (Ϫ19858 Ϫ 6618)

La liacutenea aeacuterea puede tener una seguridad del 90 de que el ingreso por los boletos en una ofminuye entre $6600 y $19900 aproximadamente con cada liacutenea aeacuterea adicional que comp

135 Teacutecnicas de modelado

Dada una variable que deseamos explicar y un conjunto de variables explicativas potencialehaya varias ecuaciones de regresioacuten diferentes que podamos estudiar dependiendo de queacute explicativas incluyamos y de coacutemo lo hagamos Cada una de esas ecuaciones de regresioacutence como modelo Las teacutecnicas de modelado son las distintas formas en que podemos incluriables explicativas y verificar queacute tan apropiados son los modelos de regresioacuten Existen municas de modelado diferentes pero soacutelo veremos dos de las maacutes utilizadas

Datos cualitativos y variables ficticias

En todos los ejemplos de regresioacuten que hemos visto hasta ahora los datos manejados hanmeacutericos o cuantitativos Pero ocasionalmente nos enfrentaremos con una variable categoacuterilitativa En el problema del inicio el capiacutetulo el director de personal desea ver si el salarioun vendedor depende de su sexo En la tabla 13-5 repetimos los datos de dicho problema

Por el momento ignore la antiguumledad y utilice la teacutecnica desarrollada en el capiacutetulo 9 bar la diferencia entre las medias de dos poblaciones para ver si los hombres ganan maacutes qu

jeres Pruebe con ϭ 001 Si tomamos a los hombres como la poblacioacuten 1 y a las mujerespoblacioacuten 2 probaremos las siguientes hipoacutetesis

H0 1 ϭ 2 larr Hipoacutetesis nula no existe discriminacioacuten por sexo en los salarios base

H1 1 Ͼ 2 larr Hipoacutetesis alternativa se discrimina a las mujeres en su salario base

ϭ 001 larr Nivel de significancia

Revisioacuten del enfoqueanterior del problema

Buacutesqueda dediferentes modelos

25950 Ϫ 28ᎏᎏ

4877

(bPROMOC Ϫ 28)ᎏᎏ

sbPROMOC

Datos para el problemade discriminacioacuten porsexo

Tabla 13-5 Vendedores VendedorasAntiguumledad Salario base Antiguumledad Salario base(en meses) (en miles) (en meses) (en miles)

6 75 5 62

10 86 13 87

12 91 15 94

18 103 21 98

30 130

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3256

A continuacioacuten bosquejamos el anaacutelisis Si tiene problemas para seguirlo deberaacute repasamente la seccioacuten 93

n1 ϭ 5 n2 ϭ 4

x ෆ1 ϭ 97 x ෆ2 ϭ 8525

s2

1 ϭ 4415 s2

2 ϭ 2609

s2

p ϭ

ϭ

ϭ 3641

x ෆ1Ϫ x

ෆ2ϭ s pΊ ϩ

ϭ 128

t ϭ

ϭ

ϭ 092

Con siete grados de libertad el valor t criacutetico para una prueba de cola superior con ϭ 001 eComo el valor t observado de 092 es menor que 2998 no podemos rechazar H0

Entonces el anaacutelisis concluye que no parece haber discriminacioacuten por sexo en los salarPero recuerde que hasta ahora se han ignorado los datos de antiguumledad laboral para el anaacuteli

Antes de seguir vea el diagrama de dispersioacuten de los datos En la figura 13-9 los punto

corresponden a los hombres y los blancos a las mujeres El diagrama de dispersioacuten muestraridad que el salario base aumenta con los antildeos de antiguumledad pero si con la mirada sigue lo qla recta de regresioacuten notaraacute que los puntos negros tienden a estar arriba de ella y los blancos

La figura 13-10 da la salida de una regresioacuten del salario base sobre los meses de antiguumlelos resultados se ve que la antiguumledad es una variable explicativa altamente significativa

Ademaacutes r 2

ϭ 926 que indica que la variable meses de antiguumledad explica cerca del 9variacioacuten en el salario base La figura 13-11 contiene parte de la salida que no se vio antesbla de residuos Para cada punto el residuo es simplemente Y Ϫ Y ˆ que se reconoce como el

Una ldquomiradardquo a los

datos

El enfoque anterior nodetecta discriminacioacuten

(97 ndash 8525) ndash 0ᎏᎏ

128

( x ෆ1 ndash x ෆ2) ndash (1 Ϫ 2)H0

ᎏᎏᎏ

ˆ x ෆ1Ϫ

x ෆ2

1ᎏ

n2

1ᎏ

n1

4(4415) ϩ 3(2609)ᎏᎏᎏ5 ϩ 4 ndash 2

(n1 ndash 1)s21 ϩ (n2 ndash 1)s22ᎏᎏᎏ

n1 ϩ n2 ndash 2

FIGURA 13-9

Diagrama de dis-persioacuten de salariosbase contra mesesde antiguumledad

4 8 12 16 20 24 28

4

8

12

Meses de antiguumledad

S a l a r i o ( m i l e s d e d oacute l a r e s )

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3356

el ajuste de la recta de regresioacuten en ese punto En la figura 13-11 AJUST1 son los valores y RESI1 son los residuos

Tal vez la parte maacutes importante del anaacutelisis del resultado de una regresioacuten sea estusiduos Si la regresioacuten incluye todos los factores explicativos relevantes estos residuo

ser aleatorios Dicho de otro modo si los residuos muestran cualquier patroacuten no aleat

to indica que hay algo sistemaacutetico que afecta el proceso y que no hemos tomado en cu

manera que buscamos patrones en los residuos o para decirlo de forma maacutes pintoresca ldquopmos a los residuos hasta hacerlos hablarrdquo

Si observamos los residuos presentados en la figura 13-11 vemos que los primeros cincoson positivos De modo que para los vendedores tenemos Y ndash Y ˆ Ͼ 0 o Y Ͼ Y ˆ es decir laregresioacuten cae abajo de estos cinco puntos Tres de los cuatro uacuteltimos residuos son negaticonsiguiente para las vendedoras tenemos Y Ϫ Y ˆ Ͻ 0 o Y Ͻ Y ˆ asiacute que la recta de regresicuentra arriba de tres de los cuatro puntos Esto confirma lo que vimos al observar el diagdispersioacuten de la figura 13-9 Este patroacuten no aleatorio en los residuos sugiere que el sexo siacute etor determinante del salario base

iquestCoacutemo podemos incorporar el sexo de los vendedores dentro del modelo de regresioacutencemos utilizando un dispositivo llamado variable ficticia (o variable indicadora) Para lpuntos que representan a los vendedores esta variable tiene valor de 0 y para los cuatro purepresentan a las vendedoras valdraacute 1 Los datos de entrada para nuestra regresioacuten con variticias se dan en la tabla 13-6

Para los datos de la tabla 13-6 se ajusta una regresioacuten de la forma

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

Uso de variablesficticias

Deteccioacuten depatrones en losresiduos

ldquoPresionar a losresiduosrdquo

Anaacutel i s i s de r e gr e s i oacuten

La ec uac i oacuten de r e gr es i oacuten esSALARI O ϭ 5 81 ϩ 0 233 MESES

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t pCons t a nt e 5 8093 0 4038 14 39 0 000MESES 0 23320 0 02492 9 36 0 000

s ϭ 0 5494 R- s q ϭ 92 6

Anaacute l i s i s de va r i a nz aFUENTE GL SC MC F Re gr e s i oacuten 1 26 443 24 443 87 61 0Er r or 7 2 113 0 302Tot a l 8 28 556

FIGURA 13-10

Regresioacuten conMinitab del salariobase sobre losmeses deantiguumledad

RENGLOacuteN SALARI O AJ UST1 RESI 1

1 7 5 7 2085 0 2914992 8 6 8 1413 0 458684

3 9 1 8 6077 0 4922764 10 3 10 0069 0 2930545 13 0 12 8054 0 1946076 6 2 6 9753 - 0 7752977 8 7 8 8409 - 0 1409288 9 4 9 3073 0 0926649 9 8 10 7066 - 0 906558

FIGURA 13-11

Tabla de residuosde Minitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1156

te que existe cierta relacioacuten entre estas recompensas y el descubrimiento de impuestos no pEn la tabla 13-3 se registroacute la informacioacuten de los uacuteltimos 10 meses

Para resolver este problema la divisioacuten de auditoriacutea usoacute el procedimiento de regresioacutende Minitab Por supuesto todaviacutea no sabemos coacutemo interpretar la solucioacuten que proporciocomo veremos la mayor parte de los nuacutemeros dados en la solucioacuten corresponden muy de c

los estudiados en el contexto de regresioacuten simple

Salida de Minitab

Una vez que se introducen los datos y se eligen las variables dependiente e independientescalcula los coeficientes de regresioacuten y varios estadiacutesticos asociados con la ecuacioacuten de regrveraacute la salida del programa para el problema del IRS La figura 13-2 da la primera parte de la

1 La ecuacioacuten de regresioacuten De los nuacutemeros dados en la columna Coef se puede leercioacuten de estimacioacuten

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ b3 X 3

ϭ Ϫ45796 ϩ 0597 X 1 ϩ 1177 X 2 ϩ 0405 X 3

Podemos interpretar esta ecuacioacuten en una forma similar a la de la ecuacioacuten de regresioacutevariables en la paacutegina 558 Si se mantienen constantes el nuacutemero de horas de audicampo X 1 y el nuacutemero de horas de computadora X 2 y se cambian las recompeninformantes X 3 entonces el valor de Y ˆ aumentaraacute $405000 por cada $1000 pagadosformantes De igual manera al mantener X 1 y X 3 constantes se ve que por cada 1adicionales de tiempo de computadora Y ˆ aumentaraacute $1177000 Por uacuteltimo si se dej

Buacutesqueda e interpre-tacioacuten de la ecuacioacutende regresioacuten

Salida del programaMinitab

Uso de Minitab pararesolver problemasde regresioacuten muacuteltiple

Factores relacionadoscon el descubrimientode impuestos nopagados

Tabla 13-3 Horas en Impueauditoriacuteas Horas Recompensa pagde campo en computadora a informantes descub(cientos) (cientos) (miles) (mill

Mes X 1 X 2 X 3

Enero 45 16 71 2

Febrero 42 14 70 2

Marzo 44 15 72 2

Abril 45 13 71 2

Mayo 43 13 75 2

Junio 46 14 74 2

Julio 44 16 76 3

Agosto 45 16 69 2

Septiembre 44 15 74 2

Octubre 43 15 73 2

FIGURA 13-2

Salida de Minitabpara la regresioacuten

del ServicioInterno deContribuciones

Anaacutel i s i s de r e gr e s i oacuten

La ec ua ci oacuten de r egr es i oacuten es

DESCUBRE ϭ mdash45 0 ϩ 0 597 AUDI T ϩ 1 18 COMPUTADORA ϩ 0 405 RECOMPENS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e Ϫ45 796 4 878 Ϫ9 39 0 000AUDI T 0 50697 0 08112 7 36 0 000COMPUTADORA 1 17684 0 08407 14 00 0 000RECOMPENSA 0 40511 0 04223 9 59 0 000

s ϭ 0 2861 R- s q ϭ 98 3

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1256

tantes X 2 y X 3 se estima que 100 horas adicionales dedicadas a auditoriacuteas de campo descubri-raacuten $597000 adicionales de impuestos no pagados Observe que se redondearon los valoresproporcionados por la regresioacuten dada por Minitab (figura 13-2)

Suponga que en noviembre el IRS intenta dejar las horas de trabajo en auditoriacuteas de cam-po y las horas en computadora en sus niveles de octubre (4300 y 1500) pero decide aumen-tar las recompensas pagadas a los informantes a $75000 iquestCuaacutento de impuestos no pagadosesperan descubrir en noviembre Sustituyendo estos valores en la ecuacioacuten de regresioacuten esti-mada obtenemos

Y ˆ ϭ Ϫ45796 ϩ 0597 X 1 ϩ 1177 X 2 ϩ 0405 X 3

Y ˆ ϭ Ϫ45796 ϩ 0597(43) ϩ 1177(15) ϩ 0405(75)

Y ˆ ϭ Ϫ45796 ϩ 25671 ϩ 17655 ϩ 30375

Y ˆ ϭ 27905 larr Descubrimientos estimados $27905000

De modo que el departamento de auditoriacuteas espera descubrir aproximadamente $28 millonesde evasioacuten de impuestos en noviembre

2 Una medida de dispersioacuten el error estaacutendar de la estimacioacuten de la regresioacuten muacuteltiple Ya quehemos determinado la ecuacioacuten que relaciona a nuestras tres variables necesitamos una me-dida de la dispersioacuten alrededor de este plano de regresioacuten muacuteltiple En la regresioacuten simple laestimacioacuten es maacutes precisa conforme el grado de dispersioacuten alrededor de la regresioacuten es menorLo mismo es cierto para los puntos de la muestra que se encuentran alrededor del plano de re-gresioacuten muacuteltiple Para medir esta variacioacuten debemos utilizar de nuevo la medida conocida co-

mo error estaacutendar de la estimacioacuten

Medicioacuten de ladispersioacuten alrededordel plano de regre-sioacuten muacuteltiple usodel error estaacutendar dela estimacioacuten

Error estaacutendar de la estimacioacuten

se ϭ Ί [13-6]Y ndash Y ˆ )2ᎏᎏ

n Ϫ k Ϫ 1

donde

bull Y ϭ valores muestrales de la variable dependientebull Y ˆ ϭ valores correspondientes estimados con la ecuacioacuten de regresioacutenbull n ϭ nuacutemero de puntos de la muestrabull k ϭ nuacutemero de variables independientes (ϭ 3 en nuestro ejemplo)

El denominador de esta ecuacioacuten indica que en la regresioacuten muacuteltiple con k variables in-

dependientes el error estaacutendar tiene n Ϫ k Ϫ 1 grados de libertad Esto se debe a que los

grados de libertad se reducen de n en k ϩ 1 constantes numeacutericas a b1 b2 hellip b k que se

estimaron a partir de la misma muestra

Para calcular se observamos los errores individuales (Y Ϫ Y ˆ ) en el plano de regresioacuten ajus-tado los elevamos al cuadrado calculamos su media (dividiendo entre n Ϫ k Ϫ 1 en lugar den) y tomamos la raiacutez cuadrada del resultado Debido a la forma en que se calcula se se cono-ce a veces como raiacutez del error cuadraacutetico medio [o raiacutez de mse (mean-square error)] De lasalida de Minitab que usa s en lugar de se para denotar el error estaacutendar vemos que la raiacutez demse en el problema del Servicio Interno de Contribuciones es 0286 es decir $286000

Como en el caso de la regresioacuten simple podemos utilizar el error estaacutendar de la estimacioacuteny la distribucioacuten t para formar un intervalo de confianza alrededor de nuestro valor estimadoY ˆ En el problema de la evasioacuten de impuestospara 4300 horas de trabajo en auditoriacuteas de cam-po 1500 horas en computadora y $75000 de pago a informantes Y ˆ es $27905000 como es-timacioacuten de impuestos no pagados descubiertos y se es $286000 Si deseamos construir unintervalo de confianza del 95 alrededor de esta estimacioacuten de $27905000 miramos enla tabla 2 del apeacutendice en la columna del 5 y localizamos ahiacute el rengloacuten correspondiente a

Intervalos deconfianza para Y ˆ

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1356

n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad El valor apropiado de t para nuestracioacuten del intervalo es de 2447 En consecuencia podemos calcular los liacutemites de nutervalo de confianza como sigue

Y ˆ ϩ t (se) ϭ 27905000 ϩ (2447)(286000)

Y ˆ ϩ t(se) ϭ 27905000 ϩ 699800

Y ˆ ϩ t(se) ϭ 28604800 larr Liacutemite superior

Y ˆ Ϫ t (se) ϭ 27905000 Ϫ (2447)(286000)

Y ˆ ϩ t(se) ϭ 27905000 ndash 699800

Y ˆ ϩ t(se) ϭ 27205200 larr Liacutemite inferior

Con un nivel de confianza del 95 el departamento de auditoriacuteas puede sentirse sque los descubrimientos reales estaraacuten en este intervalo que va de $27205200 a $28Si el IRS desea usar un nivel de confianza menor como 90 puede reducir el intevalores para la estimacioacuten de descubrimientos de impuestos no pagados Igual que cgresioacuten simple podemos utilizar la distribucioacuten normal estaacutendar (tabla 1 del apeacutendaproximar la distribucioacuten t siempre que los grados de libertad (n menos el nuacutemero cientes de regresioacuten estimados) sea un nuacutemero mayor que 30

Al antildeadir la tercera variable independiente (recompensas a informantes) iquestmejoroacuteregresioacuten Como se mide la dispersioacuten de los datos alrededor del plano de regresioacutenmenores de se deberiacutean indicar mejores regresiones Para la regresioacuten de dos variablecimos con anterioridad en este mismo capiacutetulo se resultoacute ser 1076 Como al agregarra variable se se redujo a 0286 vemos que siacute mejoroacute el ajuste de la regresioacuten en este Sin embargo en general no es cierto que al agregar variables siempre se reduzc

3 El coeficiente de determinacioacuten muacuteltiple Al estudiar el anaacutelisis de correlacioacuten simpmos la fuerza de la relacioacuten entre dos variables utilizando el coeficiente de determinla muestra r 2 Este coeficiente de determinacioacuten es la fraccioacuten de la variacioacuten total riable dependiente Y que se explica con la ecuacioacuten de estimacioacuten

Similarmente en la correlacioacuten muacuteltiple mediremos la fuerza de la relacioacuten entre trbles utilizando el coeficiente de determinacioacuten muacuteltiple R

2 o su raiacutez cuadrada R (el cte de correlacioacuten muacuteltiple) Este coeficiente de determinacioacuten muacuteltiple es tambieacuten la

que representa la porcioacuten de la variacioacuten total de Y que ldquoexplicardquo el plano de regr

Note que la salida del programa da el valor 983 para R2 Esto nos dice que las tr

bles independientes explican el 983 de la variacioacuten total de impuestos no pagadobiertos Para la regresioacuten de dos variables hecha antes R2 es soacutelo 0729 asiacute que las trabajo en auditoriacutea de campo y las horas en computadora explican el 729 de la vaagregar las recompensas a los informantes explica el 254 restante de la variacioacuten

Todaviacutea no hemos explicado los nuacutemeros en las columnas etiquetadas con Desvciente t y p de la figura 13-2 Estos nuacutemeros se utilizaraacuten para hacer inferencias acercano de regresioacuten de la poblacioacuten tema que se trataraacute en la seccioacuten 13-4

Uso del coeficientede determinacioacutenmuacuteltiple

Valor de variablesadicionales

Interpretacioacuten delintervalo deconfianza

Ya nadie calcula regresiones a mano hayotras cosas maacutes interesantes en queacute ocu-par nuestro tiempo Se explicoacute la teacutecnicacalculando las soluciones a mano para

que no tenga que pensar en su computadora como en unaldquocaja negrardquo que hace muchas cosas uacutetiles que no puedeexplicar Sugerencia el valor real de usar la computadorapara calcular regresiones muacuteltiples es que puede manejarmuchas variables independientes y obtener una mejor ecua-

cioacuten de estimacioacuten que puede medir si agregar otrble independiente realmente mejora los resultados yposible observar con rapidez el comportamiento de

indica la proporcioacuten de la variacioacuten total de la variapendiente que se explica con las variables indepenLa computadora hace todo el trabajo tedioso mdashsin semdash y le deja tiempo para el trabajo maacutes importcomprender los resultados y usarlos para tomar mdecisiones

SUGERENCIASY

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1456

La ec uac i oacuten de r egr es i oacuten esY = - 12 75 + 17 1 X1 + 0 54 1 X2 - 0 17 4 X3

Pr onos t i c ador Coe f De s vEs t Coc i e nt e - t pCons t a n t e - 1275 2699 - 0 47 0 719X1 17 059 6 908 2 47 0 245X2 0 5406 0 3144 1 72 0 335X3 - 0 1743 0 1005 - 1 73 0 333

s = 396 1 R- s q = 87 2

b) iquestQueacute porcentaje de la variacioacuten total del nuacutemero de solicitudes urgentes de devolucioacuten de impuestosexplica esta ecuacioacuten

c) Para este antildeo el iacutendice econoacutemico es 169 la poblacioacuten residente en un radio de una milla desde la

oficina es 10212 habitantes y el ingreso promedio en Ithaca es $26925 iquestCuaacutentas solicitudes urgen-tes de devolucioacuten de impuestos debe Pam esperar procesar entre el 1 de marzo y el 15 de abril

Conceptos baacutesicos 13-14 Dado el siguiente conjunto de datos utilice el paquete de software que tenga disponible para encontrar la

ecuacioacuten de regresioacuten de mejor ajuste y responda a lo siguientea) iquestCuaacutel es la ecuacioacuten de regresioacutenb) iquestCuaacutel es el error estaacutendar de la estimacioacutenc) iquestCuaacutel es el valor de R

2 para esta regresioacutend) iquestCuaacutel es el valor pronosticado para Y cuando X 1 ϭ 58 X 2 ϭ 42 y X 3 ϭ 51

Y X 1 X 2 X 3

647 35 53 85809 74 16 26246 25 63 45439 37 94 88777 55 14 36206 83 92 25669 67 25 27343 12 22 13

Ejercicios 133

Ejercicios de autoevaluacioacuten

EA 13-3 Pam Schneider posee y opera un despacho de contadores en Ithaca Nueva York Ella piensa que seriacutea uacutetilpredecir el nuacutemero de solicitudes urgentes de devolucioacuten de impuestos que le pediraacuten durante el ajetrea-do periodo del 1 de marzo al 15 de abril para poder planear mejor sus necesidades de personal duranteesta eacutepoca Tiene la hipoacutetesis de que varios factores pueden ser uacutetiles para su pronoacutestico Los datos de es-tos factores y el nuacutemero de solicitudes urgentes de devolucioacuten de impuestos de antildeos pasados son

Y X 2 Nuacutemero de

Poblacioacuten solicitudesresidente X 3 de devolucioacuten

X 1 en un radio Ingreso urgentesIacutendice de una milla promedio (1 de marzo

econoacutemico desde la oficina en Ithaca a 15 de abril)

99 10188 21465 2306106 8566 22228 1266100 10557 27665 1422129 10219 25200 1721179 9662 26300 2544

a) Use el siguiente resultado de Minitab para determinar la ecuacioacuten de regresioacuten maacutes adecuada para es-

tos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1556

13-15 Dado el siguiente conjunto de datos utilice el paquete de software que tenga a su disposicioacuten patrar la ecuacioacuten de regresioacuten de mejor ajuste y responda a lo siguientea) iquestCuaacutel es la ecuacioacuten de regresioacutenb) iquestCuaacutel es el error estaacutendar de la estimacioacutenc) iquestCuaacutel es el valor de R2 para esta regresioacutend) Deacute un intervalo de confianza para la estimacioacuten del 95 para el valor Y cuando los valores X

y X 4 son 524 416 358 y 3 respectivamente

X 1 X 2 X 3 X 4 Y

214 629 219 Ϫ2 228

517 407 429 5 937418 818 698 2 649

118 410 909 Ϫ4 192

716 226 129 8 558

919 615 309 1 231

Aplicaciones

1316 Las estaciones de policiacutea en Estados Unidos estaacuten interesadas en predecir el nuacutemero de arrestodos que deberaacuten procesar cada mes para programar mejor a los empleados de oficina En los daricos el nuacutemero promedio de arrestos (Y ) cada mes tiene influencia del nuacutemero de oficiales en

policiaca ( X 1) la poblacioacuten de la ciudad en miles ( X 2) y el porcentaje de personas desempleadasdad en miles ( X 3) Los datos de estos factores en 15 ciudades se presentan en la tablaa) Utilice el paquete de software que tenga disponible para determinar la ecuacioacuten de regresioacuten

jor se ajuste a estos datosb) iquestQueacute porcentaje de la variacioacuten total en el nuacutemero de arrestos (Y ) explica esta ecuacioacutenc) El departamento de policiacutea de ChapelBoro desea pronosticar el nuacutemero de arrestos mensua

pelBoro tiene una poblacioacuten de 75000 habitantes 82 elementos en su fuerza policiaca y utaje de desempleo del 105 iquestCuaacutentos arrestos pronostica para cada mes

Nuacutemero promedio Nuacutemero de oficiales Tamantildeo de la ciudad (X 2) Porcende arrestos mensuales (Y ) en la fuerza (X 1) en miles de habitantes desemp

3906 68 816 4

5043 94 751 3

6284 125 973 5

7456 175 1235 8

5852 113 1184 11

4503 82 654 9

3278 46 616 12

2605 32 543 18

4775 89 974 4

3898 67 824 6

3124 47 564 8

3675 59 713 7

3744 61 674 9

4946 87 963 11

4875 92 864 4

13-17 Estamos intentando predecir la demanda anual (DEMAND) de cierto producto utilizando las svariables independientes

PRECIO ϭ precio del producto (en doacutelares)

INGRESO ϭ ingreso del consumidor (en doacutelares)

SUB ϭ precio de un bien sustituto (en doacutelares)

( Nota Un bien sustituto es aquel que puede suplir a otro bien Por ejemplo la margarina es untituto de la mantequilla)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1656

Se recolectaron datos correspondientes al periodo 1982-1996

Antildeo Demanda Precio ($) Ingreso ($) Sub ($)

1982 40 9 400 101983 45 8 500 141984 50 9 600 121985 55 8 700 131986 60 7 800 111987 70 6 900 151988 65 6 1000 161989 65 8 1100 17

1990 75 5 1200 221991 75 5 1300 191992 80 5 1400 201993 100 3 1500 231994 90 4 1600 181995 95 3 1700 241996 85 4 1800 21

a) Utilice el paquete de software que tenga disponible para encontrar la ecuacioacuten de regresioacuten ajuste para estos datos

b) iquestSon los signos (ϩ o Ϫ) de los coeficientes de regresioacuten de las variables independientes los qperan Deacute una explicacioacuten breve ( Nota Eacutesta no es una pregunta estadiacutestica soacutelo necesita pesignifican los coeficientes de regresioacuten)

c) Establezca e interprete el coeficiente de determinacioacuten muacuteltiple del problemad) Establezca e interprete el error estaacutendar de la estimacioacuten para el problemae) Seguacuten la ecuacioacuten de regresioacuten obtenida iquestqueacute valor de DEMAND predeciriacutea si el precio de

ductos fue $6 el ingreso del consumidor $1200 y el precio del bien sustituto $17 13-18 Bill Buxton profesor de estadiacutestica de una prominente escuela de administracioacuten tiene un prof

tereacutes en los factores que afectan el desempentildeo de los estudiantes en los exaacutemenes El examen psemestre anterior tuvo una distribucioacuten de calificaciones amplia pero Bill tiene la certeza de qfactores explican esa distribucioacuten permite a sus estudiantes que estudien en tantos libros comoca el coeficiente de inteligencia de los estudiantes variacutea tienen distintas edades y difieren losque dedican a estudiar Con el propoacutesito de desarrollar una foacutermula de prediccioacuten para las califde los exaacutemenes Bill pidioacute a cada estudiante que respondiera al final del examen preguntas refe

tiempo de estudio y nuacutemero de libros utilizados Los registros que teniacutea Bill ya incluiacutean el coefiinteligencia y la edad de modo que reunioacute los datos del grupo y corrioacute la regresioacuten muacuteltiple deLa salida de la corrida de Bill fue la siguiente

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t Con s t a nt e minus49 948 41 55 minus1 20 0HORAS 1 06931 0 98163 1 09 0CI 1 36460 0 37627 3 63 0LI BROS 2 03982 1 50799 1 35 0EDAD minus1 79890 0 67332 minus2 67 0

s = 11 657 R- s q = 76 7

a) iquestCuaacutel es la ecuacioacuten de regresioacuten de mejor ajuste para estos datos

b) iquestQueacute porcentaje de la variacioacuten en las calificaciones se explica con esta ecuacioacutenc) iquestQueacute calificacioacuten esperariacutea usted para un estudiante de 21 antildeos de edad con un coeficiente gencia (CI) de 113 que estudioacute durante cinco horas y utilizoacute tres libros diferentes

13-19 La compantildeiacutea de tiendas de abarrotes Twenty-Two estaacute planeando expandir su cadena Como ayudleccionar los lugares donde abriraacute las nuevas tiendas recolectoacute datos de las ventas semanales de casus 23 tiendas Para explicar la variabilidad de las ventas semanales tambieacuten reunioacute informacioacutencribe cuatro variables que se cree estaacuten relacionadas con las ventas Las variables se definen como

VENTAS ϭ ventas semanales promedio en cada tienda en miles de doacutelares

AUTOS ϭ volumen promedio de traacutensito de automoacuteviles por semana en miles de autos

ENTRADA ϭ facilidad de entradasalida medida en una escala de 1 a 100

INGANUAL ϭ ingreso anual promedio por familia en el aacuterea en miles de doacutelares

DISTANCIA ϭ distancia en millas desde la tienda al supermercado maacutes cercano

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1756

Los datos se analizaron con Minitab y la salida es la siguiente

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t Cons t a nt e 175 37 92 62 1 89 0 0AUTOS - 0 028 0 315 minus0 09 0 9ENTRADA 3 775 1 272 2 97 0 0I NGANUAL 1 990 4 510 0 44 0 6DI STANCI A 212 41 28 090 7 56 0 0

s = 85 587 R- s q = 95 8

a) iquestCuaacutel es la ecuacioacuten de regresioacuten de mejor ajuste dada por Minitab

b) iquestCuaacutel es el error estaacutendar de la estimacioacuten para esta ecuacioacutenc) iquestQueacute fraccioacuten de la variacioacuten en las ventas se explica con esta regresioacutend) iquestQueacute ventas predeciriacutea para una tienda localizada en un vecindario que tuvo un ingreso anu

milia de $20000 estaba a 2 millas del supermercado maacutes cercano se encontraba en una calvolumen promedio semanal de traacutensito de 100000 autos y con una facilidad de entrada de

13-20 Rick Blackburn estaacute pensando en vender su casa Con el fin de decidir el precio que pediraacute poreunido datos de 12 ventas recientes Registroacute el precio de venta (en miles de doacutelares) el nuacutemercuadrados de construccioacuten (en cientos de pies cuadrados) el nuacutemero de pisos el nuacutemero de bantiguumledad de la casa (en antildeos)

Precio de venta Pies cuad Pisos Bantildeos Antiguumledad

4965 89 1 10 2

6795 95 1 10 68115 126 2 15 11

8160 129 2 15 8

9150 190 2 10 22

9525 176 1 10 17

10035 200 2 15 12

10425 206 2 15 11

11265 205 1 20 9

14970 251 2 20 8

16065 227 2 20 18

23250 408 3 40 12

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de

de mejor ajuste para los datosb) iquestCuaacutel es el valor de R2 para esta ecuacioacutenc) Si la casa de Rick tiene 1800 pies cuadrados (ϭ 180 cientos de pies cuadrados) un piso

y seis antildeos de antiguumledad iquestqueacute precio de venta puede esperar Rick 13-21 La Allegheny Steel Corporation ha estado buscando los factores que influyen en la cantidad de

millones de toneladas) que puede vender cada antildeo La administracioacuten sospecha que los siguientfactores principales la tasa anual de inflacioacuten del paiacutes el precio promedio por tonelada del acetado que acota los precios (en doacutelares) de Allegheny y el nuacutemero de automoacuteviles (en millonesfabricantes de autos de Estados Unidos planean producir ese antildeo Se recolectaron los datos de losiete antildeos

Y X 2 X 3

Millones X 1 Cota de Nuacutemero

de tons Tasa de importa- deAntildeo vendidas inflacioacuten ciones automoacuteviles

1993 42 31 310 62

1992 31 39 500 51

1991 40 75 220 57

1990 47 107 450 71

1989 43 155 435 65

1988 37 130 260 61

1987 35 110 305 59

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1856

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de regresioacutende mejor ajuste para los datos

b) iquestQueacute porcentaje de la variacioacuten total de la cantidad de acero vendido (en millones de toneladas) porAllegheny cada antildeo explica esta ecuacioacuten

c) iquestCuaacutentas toneladas de acero deberaacute esperar Allegheny vender en un antildeo en el que la tasa de inflacioacutenes 71 los fabricantes de automoacuteviles norteamericanos planean producir 60 millones de autos y la co-ta promedio del acero importado por tonelada es $350

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-3 De la salida del paquete de software se obtienen los siguientes resultadosa) Y ˆ ϭ Ϫ1275 ϩ 17059 X 1 ϩ 05406 X 2 Ϫ 01743 X 3b) R

2ϭ 872 el modelo explica el 872 de la variacioacuten total en Y

c) Y ˆ ϭ Ϫ1275 ϩ 17059(169) ϩ 05406(10212) Ϫ 01743(26925) ϭ 2436 reembolsos de impuestos

134 Inferencias sobre paraacutemetrosde poblacioacuten

En el capiacutetulo 12 se vio que la recta de regresioacuten de la muestra Y ˆ ϭ a ϩ bX (ecuacioacuten 12-3) esti-maba la recta de regresioacuten de la poblacioacuten Y ϭ A ϩ BX (ecuacioacuten 12-13) La razoacuten por la cual soacute-lo podiacuteamos estimar la recta de regresioacuten de poblacioacuten y no determinarla con exactitud era que los

puntos no caen exactamente en la recta de regresioacuten de la poblacioacuten Debido a las variaciones alea-torias los puntos satisfaciacutean Y ϭ A ϩ BX ϩ e (ecuacioacuten 12-13a) maacutes que a Y ϭ A ϩ BX

En la regresioacuten muacuteltiple se tiene justo la misma situacioacuten Nuestro plano de regresioacuten estimado

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k [13-5]

es una estimacioacuten de un plano de regresioacuten de poblacioacuten verdadero pero desconocido de la forma

Plano de regresioacutende la poblacioacuten

De nuevo los puntos individuales normalmente no caen con exactitud en el plano de regresioacuten depoblacioacuten Consideremos el problema del Servicio Interno de Contribuciones para ver por queacute Notodos los pagos a informantes tendraacuten la misma efectividad Algunas horas en computadora podriacuteanutilizarse para recolectar y organizar datos otras para analizar esos datos en busca de errores y frau-des El eacutexito de la computadora en descubrir impuestos no pagados puede depender de cuaacutento tiempose dedique a cada una de estas actividades Por eacutestas y otras razones algunos de los puntos se en-contraraacuten arriba del plano de regresioacuten y algunos estaraacuten abajo de eacuteste En lugar de satisfacer laecuacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

los puntos individuales satisfaraacuten la ecuacioacuten

Las variaciones alea-torias desplazan lospuntos del plano deregresioacuten

Ecuacioacuten de regresioacuten de la poblacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

Plano de regresioacuten de la poblacioacuten maacutes la variacioacuten aleatoria

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e [13-7a]

La cantidad e que aparece en la ecuacioacuten 13-7a es una variacioacuten aleatoria que en promedio es iguala cero La desviacioacuten estaacutendar de las variaciones individuales e y el error estaacutendar de la estima-cioacuten se que estudiamos en la seccioacuten anterior es una estimacioacuten de e

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1956

Como nuestro plano de regresioacuten de la muestra Y ˆ ϭ a ϩ b1X1 ϩ b2 X 2 ϩ ϩ bk X k (ecuaci13-7) estima el plano de regresioacuten de poblacioacuten desconocido Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk

(ecuacioacuten 13-7) deberemos ser capaces de usarlo para hacer inferencias sobre el plano de regreside la poblacioacuten En esta seccioacuten haremos inferencias acerca de las pendientes ( B1 B2 Bk ) deecuacioacuten de regresioacuten ldquoverdaderardquo (la que se aplica a la poblacioacuten completa) basadas en las pendietes (b1 b2 bk ) de la ecuacioacuten de regresioacuten estimada a partir de la muestra de datos

Inferencias acerca de una pendiente individual B i El plano de regresioacuten se deriva de una muestra y no de la poblacioacuten completa Como resultado

podemos esperar que la ecuacioacuten de regresioacuten verdadera Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k que se aplica a la poblacioacuten completa) sea exactamente igual que la ecuacioacuten estimada a partir observaciones de la muestra Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k Sin embargo podemos utilizarvalor de bi una de las pendientes que calculamos a partir de la muestra para probar hipoacutetesis acca del valor de Bi una de las pendientes del plano de regresioacuten para la poblacioacuten completa

El procedimiento para probar una hipoacutetesis respecto a Bi es parecido al procedimiento analizaen los capiacutetulos 8 y 9 sobre pruebas de hipoacutetesis Para entender este proceso regresemos al probma que relaciona los impuestos no pagados descubiertos con las horas de trabajo en auditoriacuteas campo horas en computadora y recompensas a informantes En la paacutegina 729 sentildealamos que b10597 El primer paso consiste en encontrar un valor para B1 y compararlo con b1 ϭ 0597

Suponga que durante un periodo largo la pendiente de la relacioacuten entre Y y X 1 fue 0400 Paprobar si todaviacutea es vaacutelida podriacuteamos definir las hipoacutetesis como

H0 B1 ϭ 0400 larr Hipoacutetesis nula

H1 B1 0400 larr Hipoacutetesis alternativa

De hecho realizamos la prueba para saber si los datos actuales indican que B1 ha cambiado su vahistoacuterico de 0400

Para encontrar el estadiacutestico de prueba para B1 es necesario hallar primero el error estaacutendar d

coeficiente de regresioacuten El coeficiente de regresioacuten con el que estamos trabajando es b1 de moque el error estaacutendar de este coeficiente se representa con sb1

Resulta demasiado difiacutecil calcular sb1 a mano pero por fortuna Minitab calcula los errores estaacutedar de todos los coeficientes de regresioacuten Por comodidad repetimos la figura 13-2 Los errores taacutendar de los coeficientes se dan en la columna DesvEst de la salida de Minitab

En el cuadro de salida vemos que sb1

es 00811 (Similarmente si deseamos probar una hipoacutesis acerca de B2 vemos que el error estaacutendar apropiado que debemos utilizar es sb2 ϭ 00841) Uvez que encontramos sb1 en la salida de Minitab podemos usar la ecuacioacuten 13-8 para estandarizarpendiente de nuestra ecuacioacuten de regresioacuten ajustada

Estandarizacioacutendel coeficiente deregresioacuten

Error estaacutendar delcoeficientede regresioacuten

Prueba de unahipoacutetesis acerca de B i

Diferencia entre la

ecuacioacuten de regre-sioacuten verdadera y unaestimada a partir delas observacionesde la muestra

Coeficiente de regresioacuten estandarizado

t ϭ [13-8bi ndash Bi0ᎏ

sbi

donde

bull biϭ pendiente de la regresioacuten ajustada

bull Bi0 ϭ pendiente real hipoteacutetica para la poblacioacutenbull sbi ϭ error estaacutendar del coeficiente de regresioacuten

iquestPor queacute utilizamos t para denotar el estadiacutestico estandarizado Recuerde que en la regresioacuten siple utilizamos a y b en la ecuacioacuten 12-7 para calcular se y que se estimaba e la desviacioacuten estaacutedar de las variaciones de los datos (ecuacioacuten 12-13a) Entonces utilizamos se en la ecuacioacuten 12-para encontrar sb el error estaacutendar del coeficiente de regresioacuten que corresponde a la pendiente E

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2056

pezamos con n puntos y los usamos para estimar los dos coeficientes a y b Luego basamtras pruebas en la distribucioacuten t con n Ϫ 2 grados de libertad

De manera similar en la regresioacuten muacuteltiple tambieacuten empezamos con n puntos pero lospara estimar k ϩ 1 coeficientes la ordenada a y k pendientes b1 b2 bk Despueacutes estcientes se usan en la ecuacioacuten 13-6 para calcular se que de nuevo es una estimacioacuten de eviacioacuten estaacutendar de las variaciones de los datos (ecuacioacuten 13-7a) Luego se utiliza se (en ucioacuten que estaacute maacutes allaacute del alcance de este libro) para encontrar s

bi Debido a lo anterior

nuestras pruebas de hipoacutetesis en la distribucioacuten t con n Ϫ k Ϫ 1 (ϭ n Ϫ ( k ϩ l)) grados de En nuestro ejemplo el valor estandarizado del coeficiente de regresioacuten es

t ϭ

ϭ

ϭ 2432 larr Coeficiente de regresioacuten estandarizado

Suponga que estamos interesados en probar nuestras hipoacutetesis al nivel de significancia

Como tenemos 10 observaciones en la muestra y tres variables independientes sabemos n Ϫ k Ϫ 1 o 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad Buscamos en la tabla 2 del apeacutendice en lana de 10 y el rengloacuten de 6 grados de libertad Ahiacute vemos que el valor apropiado de t es 19mo nos preocupa si b1 (la pendiente del plano de regresioacuten de la muestra) es significativamferente de B1 (la pendiente hipoteacutetica del plano de regresioacuten de la poblacioacuten) eacutesta es una pdos colas y los valores criacuteticos son Ϯ1943 El coeficiente de regresioacuten estandarizado es 2se encuentra fuera de la regioacuten de aceptacioacuten de nuestra prueba de hipoacutetesis Por consiguichazamos la hipoacutetesis nula de que B1 todaviacutea es igual a 0400 En otras palabras existe unacia suficientemente grande entre b1 y 0400 para concluir que B1 ha cambiado respecto a histoacuterico Por esto sentimos que cada 100 horas adicionales de trabajo en auditoriacuteas de camaumentan la cantidad de descubrimientos de impuestos no pagados en $400000 como lo hel pasado

Ademaacutes de la prueba de hipoacutetesis podemos construir un intervalo de confianza para cude los valores de Bi Del mismo modo que bi es una estimacioacuten puntual de Bi estos intervalofianza son estimaciones de intervalo de Bi Para ilustrar el proceso de construccioacuten de interconfianza encontremos un intervalo de confianza del 95 para B3 en el ejemplo del IRS Lrelevantes son

b3 ϭ 0405 de la figura 13-2sb3 ϭ 00422

t ϭ 2447 larr Nivel de significancia del 5 y 6 grados de libertad

Intervalo deconfianza para B i

Realizacioacuten de la

prueba de hipoacutetesis

0597 ndash 0400ᎏᎏ

0081

b1 ndash B10ᎏ

sb1

Anaacute l i s i s de r e gr e s i oacutenLa ec uaci oacuten de r egr es i oacuten esDESCUBRE = - 45 0 + 0 597 AUDI TORIacute A + 1 18 COMPUTADORA + 0 405 RECOMPENSA

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 45 796 4 878 - 9 39 0 000AUDI TORIacute A 0 50697 0 08112 7 36 0 000COMPUTADORA 1 17684 0 08407 14 00 0 000RECOMPENSAS 0 40511 0 04223 9 59 0 000

s = 0 2861 R- s q = 98 3

FIGURA 13-2

Salida de Minitab(figura repetida)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2156

Con esta informacioacuten podemos calcular el intervalo de confianza de la siguiente manera

b3 ϩ t (sb3) ϭ 0405 ϩ 2447(00422)

ϭ 0508 larr Liacutemite superior

b3 Ϫ t (sb3) ϭ 0405 Ϫ 2447(00422)

ϭ 0302 larr Liacutemite inferior

Vemos que podemos tener una seguridad del 95 de que cada $1000 adicionales pagados a los formantes aumenta el descubrimiento de impuestos no pagados en una cantidad entre $302000$508000

A menudo estaremos interesados en preguntas del tipo iquesten realidad Y depende de X i Por ejeplo podriacuteamos preguntar si descubrir impuestos no pagados en realidad depende de las horas encomputadora Con frecuencia esta pregunta se plantea como iquestes X i una variable explicativa sigficativa de Y Si piensa un poco maacutes se convenceraacute de que si Bi 0 Y depende de las X i (esto esvariacutea cuando X i variacutea) y no depende de X i si Bi ϭ 0

Vemos que nuestra pregunta conduce a establecer hipoacutetesis de la forma

H0 Bi ϭ 0 larr Hipoacutetesis nula X i no es una variable explicativa significativa

H1 Bi 0 larr Hipoacutetesis alternativa X i es una variable explicativa significativa

Podemos probar estas hipoacutetesis utilizando la ecuacioacuten 13-8 del mismo modo que cuando probamnuestras hipoacutetesis acerca de si B1 todaviacutea era igual a 0400 Sin embargo existe una forma maacutes faacutede hacerlo usando la columna de la figura 13-2 de ldquocociente- t rdquo Observemos de nuevo la ecuaci13-8

t ϭ [13-

Como nuestro valor hipoteacutetico de Bi es cero el valor estandarizado del coeficiente de regresioacutedenotado por t o se convierte en

t o ϭ

El valor de t o se conoce como valor t ldquocalculadordquo Eacuteste es el nuacutemero que aparece en la columna equetada como ldquocociente-t rdquo en la figura 13-2 Denotemos por t c el valor t ldquocriacuteticordquo que buscamos

la tabla 2 del apeacutendice Entonces como la prueba para determinar si X i es una variable explicatisignificativa es una prueba de dos colas soacutelo necesitamos verificar si Ϫt c Յ t o Յ t c

Uso de valores t

calculados en lasalida de Minitab

biᎏ

sbi

bi ndash Bi0ᎏ

sbi

iquestEs significativa unavariable explicativa

Prueba para determinar si una variable es o no significativa

Ϫt c Յ t o Յ t c [13-9

donde

bull t c ϭ valor t adecuado (con n Ϫ k Ϫ 1 grados de libertad) para el nivel de significancia deprueba

bull t o ϭ bi sbi ϭ valor t observado (o calculado) obtenido con el paquete de software

Si t o

cae entre Ϫt c

y t c aceptamos H0 y llegamos a la conclusioacuten de que X

ino es una variable exp

cativa significativa En cualquier otro caso rechazamos H0 y concluimos que X i es una variable eplicativa significativa

Probemos al nivel de significancia de 001 si las horas en computadora constituyen una variabexplicativa significativa para los impuestos no pagados descubiertos De la tabla 2 del apeacutendice cn Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad y ϭ 001 vemos que t c ϭ 3707 De la figura 13tenemos que t o = 1400 Como t o Ͼ t c concluimos que el tiempo en computadora es una variab

Prueba de lasignificancia de lavariable horas decomputadora en elproblema del IRS

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2256

explicativa significativa De hecho al observar los valores t calculados para las otras dos vindependientes (tiempo de auditoriacuteas de campo t o ϭ 736 y recompensa a informantes t ovemos que tambieacuten son variables explicativas significativas

Podemos tambieacuten utilizar la columna de ldquoprdquo para probar si X i es una variable explicativacativa De hecho utilizando esa informacioacuten ni siquiera necesitamos usar la tabla 2 del aLos elementos de esta columna son los valores prob para las hipoacutetesis

H0 Biϭ 0

H1 Bi 0

Recuerde del anaacutelisis hecho en el capiacutetulo 9 que estos valores prob constituyen la probabque cada bi esteacute tan lejos de cero como (o maacutes) el valor observado obtenido de la regresioacutenverdadera Como se ilustra en la figura 13-3 solamente necesitamos comparar estos valocon el nivel de significancia de la prueba para determinar si X i es o no una variable expsignificativa para Y

Probar la significancia de una variable explicativa es siempre una prueba de dos colas Lble independiente X i es una variable explicativa significativa si bi es significativamente dife

cero es decir si t o es un nuacutemero grande positivo o negativoPara el ejemplo del IRS repetimos las pruebas con ϭ 001 Para cada una de las tres v

independientes p es menor que 001 de forma que podemos concluir que cada una de ellanificativa

Inferencias acerca de la regresioacuten como un todo

(usando una prueba F )

Suponga que cubre con papel un tablero para dardos y lanza varios dardos sobre eacutel Despueacuteberlo hecho tendraacute algo muy parecido a un diagrama de dispersioacuten Suponga entonces quuna recta de regresioacuten a este conjunto de ldquopuntos observadosrdquo y calcula r

2 Debido a que lofueron lanzados aleatoriamente usted espera obtener un valor bajo de r

2 puesto que en esten realidad no explica a Y Sin embargo si hace esto muchas veces ocasionalmente observalor alto de r

2 por pura casualidadDada cualquier regresioacuten simple (o muacuteltiple) es natural preguntarse si el valor de r2 (

realmente indica que las variables independientes explican a Y o si esto sucede por cas

A menudo esta interrogante se plantea de la siguiente manera iquestla regresioacuten como un todo ficativa En la uacuteltima seccioacuten vimos coacutemo decidir si una X i individual es una variable exp

Significancia de laregresioacuten comoun todo

FIGURA 13-3

Uso de ldquoprdquo paradeterminar si X i esuna variable expli-cativa significativa

Regioacuten de aceptacioacuten Regioacuten de aceptacioacuten

2 del aacuterea

2 del aacuterea

2 del aacuterea

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

ndasht c

ndasht o

t o

t c

0

(a) p es mayor que X

i no es una variable

explicativa significativa

(b) p es menor que X

i es una variable

explicativa significativa

ndasht o

ndasht c

t c

0

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2356

significativa ahora veremos coacutemo decidir si todas las X i tomadas en conjunto explican significavamente la variabilidad observada de Y Nuestras hipoacutetesis son

H0 B1 ϭ B2 ϭ ϭ Bk ϭ 0 larr Hipoacutetesis nula Y no depende de las X i

H1 por lo menos una Bi 0 larr Hipoacutetesis alternativa Y depende de al menos una de las X i

Cuando analizamos r 2 en el capiacutetulo 12 consideramos la variacioacuten total en Y sum(Y Ϫ Y ෆ )2 la p

te de dicha variacioacuten que explica la regresioacuten sum(Y ˆ Ϫ Y ෆ )2 y la parte no explicada de la variacioacutensum(Y Ϫ Y ˆ )2 La figura 13-4 es un duplicado de la figura 12-15 Sirve como repaso de la relacioacuten etre la desviacioacuten total la desviacioacuten explicada y la desviacioacuten no explicada para un solo dato en uregresioacuten simple Aunque no podamos dibujar una figura similar para una regresioacuten muacuteltiple coceptualmente estamos haciendo lo mismo

Al analizar la variacioacuten en Y fijamos nuestra atencioacuten en tres teacuterminos diferentes cada uno de cuales es una suma de cuadrados Los denotamos con

Suma de cuadradosy sus grados delibertad

Anaacutelisis de lavariacioacuten de losvalores Y

FIGURA 13-4

Desviacioacuten totaldesviacioacutenexplicada ydesviacioacuten noexplicada paraun valor observadode Y

Y

X

Un valor observado de lavariable dependiente (Y )

R e c t a d

e r e g r e s

i oacute n

Desviacioacuten no explicada de esta Y respectoa su media Y

(Y ndash Y )^

Desviacioacuten explicada deesta Y respecto a su media Y

(Y ndash Y )^Y

Valor estimado de esta Y

a partir de la recta de regresioacuten (Y )^

Desviacioacuten total de esta Y

respecto a su media Y

(Y ndash Y )

Tres sumas de cuadrados

SCT ϭ suma de cuadrados total (es decir la parte explicada) ϭ sum(Y Ϫ Y ෆ )2

SCR ϭ suma de cuadrados de la regresioacuten (es decir la parte explicada) ϭ sum(Y ˆ Ϫ Y ෆ )2 [13-10

SCE ϭ suma de cuadrados del error (es decir la parte no explicada) ϭ sum(Y Ϫ Y ˆ )2

Estaacuten relacionadas por la ecuacioacuten

que dice que la variacioacuten total en Y puede dividirse en dos partes la parte explicada y la no explicaCada una de estas sumas de cuadrados tiene un nuacutemero asociado de grados de libertad SCT t

ne n Ϫ 1 grados de libertad (n observaciones menos un grado de libertad debido a que la media la muestra estaacute fija) SCR tiene k grados de libertad porque existen k variables independientes qse utilizaron para explicar Y Finalmente SCE tiene n Ϫ k Ϫ 1 grados de libertad porque utilizamnuestras n observaciones para estimar k ϩ 1 constantes a b1 b2 bk Si la hipoacutetesis nula es ci

ta el cociente

Descomposicioacuten de la variacioacuten total de Y

SCT ϭ SCR ϩ SCE [13-1

Cociente F

F ϭ [13-12SCR k ᎏᎏ

SCE(n ndash k ndash 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2456

tiene una distribucioacuten F con k grados de libertad en el numerador y n Ϫ k Ϫ 1 grados de libel denominador Si la hipoacutetesis nula es falsa entonces el cociente tiende a ser maacutes grande qula hipoacutetesis nula es verdadera De modo que si el cociente F es demasiado grande (seguacuten lo na el nivel de significancia de la prueba y el valor apropiado de la tabla 6 del apeacutendice) rechH0 y concluimos que la regresioacuten como un todo es significativa

La figura 13-5 presenta la salida de Minitab para el problema del IRS Esta parte del rincluye los cocientes F calculados para la regresioacuten en ocasiones llamado anaacutelisis de v

(ANOVA) para la regresioacuten Probablemente se pregunte si esto tiene algo que ver con el anaacutelisrianza que estudiamos en el capiacutetulo 11 La respuesta es siacute Aunque no lo hicimos es posibletrar que el anaacutelisis de varianza visto en el capiacutetulo 11 tambieacuten contempla la variacioacuten total las observaciones alrededor de la gran media y la divide en dos partes una explicada por lascias entre los distintos grupos (que corresponde a lo que llamamos varianza entre columnas)

no explicada por dichas diferencias (que corresponde a la varianza dentro de columnas) Estcisamente anaacutelogo a lo que acabamos de hacer en la ecuacioacuten 13-11Para el problema del IRS vemos que SCR ϭ 29109 (con k ϭ 3 grados de libertad) SCE

(con n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad) y que

F ϭ ϭ ϭ 11833

Los elementos en la columna ldquoMCrdquo son justo las sumas de cuadrados divididas entre sus glibertad Para 3 grados de libertad en el numerador y 6 en el denominador la tabla 6 del apeacutence que 978 es el liacutemite superior de la regioacuten de aceptacioacuten para un nivel de significancia El valor calculado de F 11833 estaacute muy por arriba de 978 de manera que se ve que la r

como un todo es altamente significativa Se puede llegar a la misma conclusioacuten si se observresultado del programa dice que ldquo prdquo es 0000 Debido a que este valor prob es menor que elsignificancia ϭ 001 se concluye que la regresioacuten completa es significativa De esta mapuede usar la p de ANOVA como prueba sin tener que utilizar la tabla 6 del apeacutendice para bvalor criacutetico de F Esto es anaacutelogo a la manera en que se usaron los valores de p en la figura ra probar la significancia de las variables explicativas individuales

Multicolinealidad en la regresioacuten muacuteltiple

En el anaacutelisis de regresioacuten muacuteltiple los coeficientes de regresioacuten a menudo se vuelven

confiables conforme aumenta el grado de correlacioacuten entre las variables independie

existe un alto nivel de correlacioacuten entre algunas de las variables independientes nos enfrenun problema que los estadiacutesticos llaman multicolinealidad

La multicolinealidad puede presentarse si deseamos estimar la recuperacioacuten de las ventaempresa y utilizamos tanto el nuacutemero de vendedores empleados como sus salarios totales Cvalores asociados con estas dos variables independientes tienen una correlacioacuten alta neceusar soacutelo un conjunto de ellos para realizar nuestra estimacioacuten De hecho al agregar una segriable que estaacute correlacionada con la primera se distorsionan los valores de los coeficientgresioacuten Sin embargo a menudo podemos predecir bien Y incluso cuando haya multicoline

Consideremos un ejemplo donde existe multicolinealidad para ver coacutemo afecta a la regresrante los 12 meses pasados el gerente del restaurante Pizza Shack ha estado poniendo unaanuncios en el perioacutedico local Los anuncios se programan y pagan el mes anterior a que ap

Un ejemplo demulticolinealidad

Definicioacuten y efecto dela multicolinealidad

9703ᎏ

0082

29109 3ᎏ

0491 6Prueba de lasignificancia de laregresioacuten en elproblema del Serviciode Contribuciones

Anaacutelisis devarianza parala regresioacuten

Prueba F de laregresioacuten como

un todo

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 29 1088 9 7029 118 52 0Er r or 6 0 4912 0 0819Tot al 9 29 6000

FIGURA 13-5Salida de Minitabanaacutelisis devarianza

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2556

Cada anuncio contiene un cupoacuten que permite llevarse dos pizzas pagando solamente la de mcio El gerente recolectoacute los datos de la tabla 13-4 y le gustariacutea utilizarlos para predecir las vpizzas

En las figuras 13-6 y 13-7 se dieron los resultados de Minitab para las regresiones respelas ventas totales sobre el nuacutemero de anuncios y sobre el costo

Para la regresioacuten sobre el nuacutemero de anuncios tenemos que el valor t observado es 395grados de libertad y un nivel de significancia de ϭ 001 se encontroacute que el valor t criacuteticdo de la tabla 2 del apeacutendice) es 3169 Como t o Ͼ t c (o de manera equivalente como p es m001) concluimos que el nuacutemero de anuncios es una variable explicativa altamente signifilas ventas totales Note tambieacuten que r 2 ϭ 610 de modo que el nuacutemero de anuncios explximadamente el 61 de la variacioacuten en las ventas de pizzas

Para la regresioacuten sobre el costo de los anuncios el valor t observado es 454 de modo qude los anuncios es una variable explicativa de las ventas totales todaviacutea maacutes significativa que ro de anuncios (para los que el valor t observado fue soacutelo 395) En esta regresioacuten r 2 ϭ 673

el costo de los anuncios explica aproximadamente el 67 de la variacioacuten de las ventas de pizComo ambas variables explicativas son altamente significativas por siacute mismas intentam

zar ambas en una regresioacuten muacuteltiple El resultado se presenta en la figura 13-8La regresioacuten muacuteltiple es altamente significativa como un todo ya que la p de ANOVA e

Uso de ambas varia-bles explicativas enuna regresioacuten muacuteltiple

Dos regresionessimples

Datos de ventas y anun-cios para el restaurantePizza Shack

Tabla 13-4 X 1 X 2 Y

Nuacutemero Costo de anuncios Venta tode anuncios publicados de pizz

Mes publicados (cientos de doacutelares) (miles de d

Mayo 12 139 436

Junio 11 120 380

Julio 9 93 301

Agosto 7 97 353

Septiembre 12 123 464

Octubre 8 114 342

Noviembre 6 93 302

Diciembre 13 143 407

Enero 8 102 385

Febrero 6 84 226

Marzo 8 112 376

Abril 10 111 352

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esVENTAS = 16 9 + 2 08 ANUNCI OS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 16 937 4 982 3 40 0 007ANUNCI OS 2 0832 0 5271 3 95 0 003

s = 4 206 R- s q = 61 0

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 1 276 31 276 31 15 62 Er r or 10 176 88 17 69Tot a l 11 453 19

Figura 13-6

Regresioacuten de lasventas sobre elnuacutemero deanuncios conMinitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2656

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2756

gar el nuacutemero de anuncios como segunda variable explicativa ademaacutes del costo de los anuncios eplica nada maacutes alrededor del 1 adicional de la variacioacuten de las ventas totales

En este punto es justo preguntarse iquestqueacute variable realmente explica la variacioacuten de las ventotales en la regresioacuten muacuteltiple La respuesta es que ambas la explican pero no podemos separ

sus contribuciones individuales debido a que estaacuten altamente correlacionadas entre siacute E

consecuencia sus coeficientes en la regresioacuten muacuteltiple tienen errores estaacutendar altos valore

calculados relativamente bajos y valores prob Ͼ | t | relativamente altos

iquestDe queacute manera nos afecta esta multicolinealidad Todaviacutea podemos hacer predicciones relativmente precisas cuando se encuentra presente note que para la regresioacuten muacuteltiple (la salida se dala figura 13-8) el error estaacutendar de la estimacioacuten que determina el ancho de los intervalos de co

fianza para las predicciones es 3989 mientras que para la regresioacuten simple con el costo de los anucios como variable explicativa (salida en la figura 13-7) tenemos se ϭ 3849 Lo que no podemhacer es predecir con mucha precisioacuten coacutemo cambiaraacuten las ventas si aumentamos en uno el nuacutemede anuncios La regresioacuten muacuteltiple dice que b1 ϭ 0625 (esto es cada anuncio aumenta las ventotales de pizzas alrededor de $625) pero el error estaacutendar de este coeficiente es 112 (es decir apximadamente $1120)

Las contribucionesindividuales nopueden separarse

Ejercicios 134

Ejercicios de autoevaluacioacuten

EA 13-4 Edith Pratt es una ocupada ejecutiva de una compantildeiacutea de transporte de carga a nivel nacional y va tara una junta porque no encuentra la salida de la regresioacuten muacuteltiple elaborada por un asistente Si la regsioacuten total es significativa al nivel 005 ella desea usar las salida de computadora como evidencia para fudamentar algunas ideas que expondraacute en la reunioacuten Sin embargo su ayudante estaacute enfermo De hectoda la informacioacuten que tiene de la regresioacuten muacuteltiple es un trozo de papel con los siguientes datos

Regresioacuten paraEdith Pratt

SCR 8724 con gl

SCE con 17 gl

SCT 10236 con 24 gl

Como el papel ni siquiera tiene todos los nuacutemeros Edith ha concluido que no es uacutetil Usted sin embardebe saber maacutes que ella iquestPuede Edith entrar en la junta o debe seguir buscando la salida de computador

EA 13-5 Una pequentildea liacutenea aeacuterea de Nueva Inglaterra realizoacute una encuesta sobre sus 15 terminales y obtuvo losguientes datos para el mes de febrero donde

VENTAS ϭ ingreso total seguacuten el nuacutemero de boletos vendidos (en miles de doacutelares)

PROMOCϭ cantidad gastada en promociones de la liacutenea aeacuterea en el aacuterea (en miles de doacutelares)

COMPET ϭ nuacutemero de liacuteneas aeacutereas que compiten en esa terminal

GRATIS ϭ nuacutemero de pasajeros que vuelan gratis (por diferentes razones)

Sugerencia el concepto de hacer infe-rencias respecto a una regresioacuten muacutelti-ple es justo lo mismo que se hizo en elcapiacutetulo 12 cuando hicimos inferencias

respecto a una recta de regresioacuten excepto que ahora se em-

plean dos o maacutes variables independientes Advertencia lamulticolinealidad es un problema que debe manejarse enla regresioacuten muacuteltiple y es necesario desarrollar una com-prensioacuten con sentido comuacuten Recuerde que todaviacutea puedehacer predicciones precisas cuando estaacute presente Pero re-cuerde tambieacuten que no puede decir con mucha precisioacuten

cuaacutento cambiaraacute la variable dependiente si ldquomanipulardquo lavariables independientes Entonces el objetivo debe seminimizar la multicolinealidad Sugerencia la mejor regresioacuten muacuteltiple es la que explica la relacioacuten entre los datos asentildealar la responsabilidad de la mayor proporcioacuten de la va

riacioacuten en la variable dependiente con el menor nuacutemero dvariables independientes Advertencia no es una buenidea incluir demasiadas variables independientes soacutelo porque cuenta con una computadora y un paquete de softwarpara estadiacutestica

SUGERENCIAS

Y

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2856

Ventas (doacutelares) Promoc (doacutelares) Compet Gratis

793 25 10 3

2001 55 8 6

1632 60 12 9

2001 79 7 16

1460 52 8 15

1777 76 12 9

309 20 12 8

2919 90 5 10

1600 40 8 43394 96 5 16

1596 55 11 7

863 30 12 6

2375 60 6 10

1072 50 10 4

1550 35 10 4

a) Utilice la siguiente salida de Minitab para determinar la ecuacioacuten de regresioacuten que mejor se ara la liacutenea aeacuterea

La ec uaci oacuten de r egr es i oacuten esVENTAS ϭ 172 ϩ 25 9 PROMOVϪ 13 2 COMPET Ϫ 3 04 GRATI S

Pr onos t i cador Coef Des vEs t Coci ent e - t Cons t ant e 172 34 51 38 3 35 0PROMOV 25 950 4 877 5 32 0COMPET - 13 238 3 686 - 3 59 0GRATI S - 3 041 2 342 - 1 30 0

b) iquestLos pasajeros que vuelan gratis ocasionan una disminucioacuten significativa en las ventas Fpruebe las hipoacutetesis apropiadas Use ϭ 005

c) iquestUn incremento de $1000 en las promociones cambia las ventas en $28000 o el cambio ecativamente diferente de $28000 Formule y pruebe las hipoacutetesis adecuadas Use ϭ 010

d) Calcule un intervalo de confianza del 90 para el coeficiente de la pendiente de la COMPET

Aplicaciones

13-22 Mark Lowtown publica el perioacutedico Mosquito Junction Enquirer y tiene problemas para predectidad de papel perioacutedico que necesita imprimir diariamente Eligioacute aleatoriamente 27 diacuteas del arior y registroacute la siguiente informacioacuten

PESO ϭ peso en libras de papel perioacutedico para la edicioacuten de ese diacutea

CLASIFICADOS ϭ nuacutemero de anuncios clasificados

PUBLICIDAD ϭ nuacutemero de anuncios publicitarios

PLANA COMPLETA ϭ nuacutemero de anuncios a una plana

Utilizando Minitab para hacer una regresioacuten de PESO sobre las otras tres variables Mark obtuguiente salida

Pr onos t i cador Coef Des vEs t Coci ent e- t Cons t ant e 1072 95 872 43 1 23 0CLASI FI CADOS 0 251 0 126 1 99 0PUBLI CI DAD 1 250 0 884 1 41 0PLANA COMPLETA 250 66 67 92 3 69 0

a) Mark siempre ha pensado que cada anuncio publicitario utiliza al menos 3 libras de papel iquestsioacuten le da una razoacuten significativa para dudar esto al nivel del 5

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2956

b) De manera similar Mark siempre ha creiacutedo que cada anuncio clasificado utiliza aproximmedia libra de papel iquestTiene ahora Mark una razoacuten significativa para dudar esto al nivel del

c) Mark vende espacios de anuncios de plana completa a los comerciantes locales a $30 la paacutegberaacute pensar en ajustar sus tarifas si el papel perioacutedico le cuesta $009 por libra Suponga costos son despreciables Establezca expliacutecitamente las hipoacutetesis y una conclusioacuten (Sugere

jando todo lo demaacutes constante cada anuncio adicional de plana completa tiene un costo de bras de papel ϫ $009 por libra ϭ $2256 El punto de equilibrio es 333333 libras iquestPor quel coeficiente de pendiente para PLANA COMPLETA es significativamente mayor que Mark no estaacute obteniendo ganancias y debe cambiar sus tarifas)

13-23 Para los datos del ejercicio 13-18 y un nivel de significancia de 010 iquestcuaacuteles variables son sign

mente explicativas de los resultados de los exaacutemenes (Habiacutea 12 estudiantes en la muestra) 13-24 Para los datos del ejercicio 13-18 y la siguiente salida de Minitab del procedimiento de regresiple hecho por Bill

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 3134 42 783 60Er r or 7 951 25 135 89Tot a l 11 4085 67

a) iquestCuaacutel es el valor observado de F b) A un nivel de significancia de 005 iquestcuaacutel es el valor criacutetico de F que se debe utilizar para d

si la regresioacuten como un todo es significativac) Basaacutendose en las respuestas a los incisos a) y b) iquestes la regresioacuten significativa como un tod

13-25 Remiacutetase al ejercicio 13-19 A un nivel de significancia de 001 iquestes la variable DISTANCIA uble explicativa significativa para VENTAS

13-26 Para los datos del ejercicio 13-19 y la siguiente salida adicional de Minitab al correr la regresioacuten

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 2861495 715374 102 39 0Er r or 18 125761 6896 7Tot a l 22 2987256

Al nivel de significancia de 005 iquestes la regresioacuten significativa como un todo

13-27 Henry Lander es el director de produccioacuten de la Alecos Corporation de Caracas Venezuela Hede que le ayude a determinar una foacutermula para predecir el ausentismo de los empacadores de chipoacutetesis es que la temperatura diaria promedio puede explicar el porcentaje de ausentismo Durios meses reuacutene datos ejecuta el procedimiento de regresioacuten simple y encuentra que la tempeplica 66 de la variacioacuten en el ausentismo Pero Henry no estaacute convencido de que eacuteste sea un cador satisfactorio Sugiere que la precipitacioacuten pluvial diaria podriacutea tambieacuten tener algo que vausentismo de modo que registra los datos correspondientes y hace una regresioacuten del ausentismte el tiempo de lluvias y obtiene un valor R2 de 059 ldquoiexclEurekardquo grita usted ldquoiexclLo tengo Con uticador que explica 66 y otro que explica 59 todo lo que tengo que hacer es una regresioacutenutilizando ambos y seguramente tendreacute un pronosticador casi perfectordquo Para su desaacutenimo sin la regresioacuten muacuteltiple tiene una R

2 de soacutelo 68 que es solamente un poco mejor que la variablperatura sola iquestCoacutemo puede explicar esta aparente discrepancia

13-28 Juan Armenlegg administrador de Rockyrsquos Diamond y Jewelry Store estaacute interesado en desamodelo para estimar la demanda del consumidor para su costosa mercanciacutea Como la mayoriacutea de

tes compran diamantes y joyas a creacutedito Juan estaacute seguro de que dos factores que deben influirmanda de los clientes son la tasa real de inflacioacuten anual y la tasa real de intereses sobre preacutestamprincipales bancos del paiacutes Explique algunos problemas que Juan podriacutea encontrar si fuera a dun modelo de regresioacuten basado en estas dos variables de prediccioacuten

13-29 Un nuevo programa de juegos Check That Model pide a los concursantes que especifiquen el nuacutenimo de paraacutemetros que necesitan para determinar si un modelo de regresioacuten muacuteltiple es signifimo un todo para ϭ 001 Usted ganoacute la apuesta con 4 paraacutemetros Use la siguiente informacioacutenterminar si la regresioacuten es significativa

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3056

R 2

ϭ 07452

SCE ϭ 1254

n ϭ 18

Nuacutemero de variables independientes ϭ 3

13-30 La Scottish Turist Agency estaacute interesada en el nuacutemero de turistas que entran al paiacutes cada semanrante la temporada alta Se recolectaron los siguientes datos

Turistas (Y ) ϭ nuacutemero de turistas que entran a Escocia en una semana (en miles)

Cambio (X 1)ϭ nuacutemero de libras escocesas compradas por $1 doacutelar

Precio (X 2) ϭ nuacutemero de libras escocesas cobradas por viaje redondo en camioacuten de Londres a Edimburgo

Promoc (X 3) ϭ cantidad gastada en promocioacuten del paiacutes (en miles de libras escocesas)Temp (X 4) ϭ temperatura media durante la semana en Edimburgo (en grados Celsius)

Turistas (Y ) Cambio (X 1) Precio (X 2) Promoc (X 3) Temp (X 4)

69 061 40 87 154

71 059 40 88 156

68 063 40 85 154

79 061 35 86 153

76 060 35 94 158

82 065 35 99 162

80 058 35 98 164

84 059 35 102 166

97 061 30 114 174

98 062 30 116 172

72 057 40 84 176

67 055 40 86 164

a) Utilice el paquete de software que tenga para determinar la ecuacioacuten de regresioacuten que mejote a los datos de la agencia de turismo

b) iquestEs la tasa de cambio una variable explicativa significativa Establezca y pruebe las hipoacutetesidas a un nivel de significancia de 010

c) Un incremento de 1000 libras en las promociones iquestaumenta el nuacutemero de turistas en maacutesEstablezca y pruebe las hipoacutetesis adecuadas para un nivel de significancia de 005

d) Calcule un intervalo de confianza del 95 para el coeficiente de la pendiente de Temp

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-4 Como SCT ϭ SCR ϩ SCE SCE ϭ SCT Ϫ SCR ϭ 10236 Ϫ 8724 ϭ 1512Como gl SCT ϭ gl SCR ϩ gl SCE gl SCR ϭ gl SCT Ϫ gl SCE ϭ 24 Ϫ 17 ϭ 7

Entonces F ϭ ϭ ϭ 1401

F CRiacuteT ϭ F (7 17 005) ϭ 261Como F OBS gt F CRIacuteT se concluye que la regresioacuten es significativa como un todo Edith debe conticando la salida de computadora de la regresioacuten para usarla en la junta

EA 13-5 De la salida de computadora se obti enen los siguientes resultadosa) VENTAS ϭ 17234 ϩ 25950PROMOC Ϫ13238COMPET Ϫ 3041GRATISb) H0 BGRATIS ϭ 0 H1 BGRATIS Ͻ 0 ϭ 005

Eacutesta es una prueba de una cola y el valor prob en los resultados es para la alternativa de dos c BGRATIS 0 De manera que para esta prueba el valor prob es 02212 ϭ 0111 Ͼ ϭ 00que no se puede rechazar H0 las ventas no disminuyen significativamente cuando aumenta ro de pasajeros que vuelan gratis

c) H0 BPROMOC ϭ 28 H1 BPROMOC 28 ϭ 010

87247ᎏᎏ

151217SCRk ᎏᎏ

SCE(n Ϫ k Ϫ 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3156

El valor observado t de los resultados de regresioacuten es

ϭ ϭ Ϫ0420

Con 11 grados de libertad y ϭ 010 en ambas colas combinadas los valores criacuteticos t parba son Ϯ1796 asiacute el valor observado estaacute dentro de la regioacuten de aceptacioacuten No se rechacambio en VENTAS para un incremento de una unidad ($1000) en PROMOC no es significate diferente de 28 ($28000)

d) Con 11 grados de libertad el valor t para un intervalo del 90 de confianza es 1796 por lo

tervalo esbCOMP Ϯ 1796sbCOMP

ϭ Ϫ13238 Ϯ 1796(3686)

ϭ Ϫ13238 Ϯ 6620 ϭ (Ϫ19858 Ϫ 6618)

La liacutenea aeacuterea puede tener una seguridad del 90 de que el ingreso por los boletos en una ofminuye entre $6600 y $19900 aproximadamente con cada liacutenea aeacuterea adicional que comp

135 Teacutecnicas de modelado

Dada una variable que deseamos explicar y un conjunto de variables explicativas potencialehaya varias ecuaciones de regresioacuten diferentes que podamos estudiar dependiendo de queacute explicativas incluyamos y de coacutemo lo hagamos Cada una de esas ecuaciones de regresioacutence como modelo Las teacutecnicas de modelado son las distintas formas en que podemos incluriables explicativas y verificar queacute tan apropiados son los modelos de regresioacuten Existen municas de modelado diferentes pero soacutelo veremos dos de las maacutes utilizadas

Datos cualitativos y variables ficticias

En todos los ejemplos de regresioacuten que hemos visto hasta ahora los datos manejados hanmeacutericos o cuantitativos Pero ocasionalmente nos enfrentaremos con una variable categoacuterilitativa En el problema del inicio el capiacutetulo el director de personal desea ver si el salarioun vendedor depende de su sexo En la tabla 13-5 repetimos los datos de dicho problema

Por el momento ignore la antiguumledad y utilice la teacutecnica desarrollada en el capiacutetulo 9 bar la diferencia entre las medias de dos poblaciones para ver si los hombres ganan maacutes qu

jeres Pruebe con ϭ 001 Si tomamos a los hombres como la poblacioacuten 1 y a las mujerespoblacioacuten 2 probaremos las siguientes hipoacutetesis

H0 1 ϭ 2 larr Hipoacutetesis nula no existe discriminacioacuten por sexo en los salarios base

H1 1 Ͼ 2 larr Hipoacutetesis alternativa se discrimina a las mujeres en su salario base

ϭ 001 larr Nivel de significancia

Revisioacuten del enfoqueanterior del problema

Buacutesqueda dediferentes modelos

25950 Ϫ 28ᎏᎏ

4877

(bPROMOC Ϫ 28)ᎏᎏ

sbPROMOC

Datos para el problemade discriminacioacuten porsexo

Tabla 13-5 Vendedores VendedorasAntiguumledad Salario base Antiguumledad Salario base(en meses) (en miles) (en meses) (en miles)

6 75 5 62

10 86 13 87

12 91 15 94

18 103 21 98

30 130

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3256

A continuacioacuten bosquejamos el anaacutelisis Si tiene problemas para seguirlo deberaacute repasamente la seccioacuten 93

n1 ϭ 5 n2 ϭ 4

x ෆ1 ϭ 97 x ෆ2 ϭ 8525

s2

1 ϭ 4415 s2

2 ϭ 2609

s2

p ϭ

ϭ

ϭ 3641

x ෆ1Ϫ x

ෆ2ϭ s pΊ ϩ

ϭ 128

t ϭ

ϭ

ϭ 092

Con siete grados de libertad el valor t criacutetico para una prueba de cola superior con ϭ 001 eComo el valor t observado de 092 es menor que 2998 no podemos rechazar H0

Entonces el anaacutelisis concluye que no parece haber discriminacioacuten por sexo en los salarPero recuerde que hasta ahora se han ignorado los datos de antiguumledad laboral para el anaacuteli

Antes de seguir vea el diagrama de dispersioacuten de los datos En la figura 13-9 los punto

corresponden a los hombres y los blancos a las mujeres El diagrama de dispersioacuten muestraridad que el salario base aumenta con los antildeos de antiguumledad pero si con la mirada sigue lo qla recta de regresioacuten notaraacute que los puntos negros tienden a estar arriba de ella y los blancos

La figura 13-10 da la salida de una regresioacuten del salario base sobre los meses de antiguumlelos resultados se ve que la antiguumledad es una variable explicativa altamente significativa

Ademaacutes r 2

ϭ 926 que indica que la variable meses de antiguumledad explica cerca del 9variacioacuten en el salario base La figura 13-11 contiene parte de la salida que no se vio antesbla de residuos Para cada punto el residuo es simplemente Y Ϫ Y ˆ que se reconoce como el

Una ldquomiradardquo a los

datos

El enfoque anterior nodetecta discriminacioacuten

(97 ndash 8525) ndash 0ᎏᎏ

128

( x ෆ1 ndash x ෆ2) ndash (1 Ϫ 2)H0

ᎏᎏᎏ

ˆ x ෆ1Ϫ

x ෆ2

1ᎏ

n2

1ᎏ

n1

4(4415) ϩ 3(2609)ᎏᎏᎏ5 ϩ 4 ndash 2

(n1 ndash 1)s21 ϩ (n2 ndash 1)s22ᎏᎏᎏ

n1 ϩ n2 ndash 2

FIGURA 13-9

Diagrama de dis-persioacuten de salariosbase contra mesesde antiguumledad

4 8 12 16 20 24 28

4

8

12

Meses de antiguumledad

S a l a r i o ( m i l e s d e d oacute l a r e s )

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3356

el ajuste de la recta de regresioacuten en ese punto En la figura 13-11 AJUST1 son los valores y RESI1 son los residuos

Tal vez la parte maacutes importante del anaacutelisis del resultado de una regresioacuten sea estusiduos Si la regresioacuten incluye todos los factores explicativos relevantes estos residuo

ser aleatorios Dicho de otro modo si los residuos muestran cualquier patroacuten no aleat

to indica que hay algo sistemaacutetico que afecta el proceso y que no hemos tomado en cu

manera que buscamos patrones en los residuos o para decirlo de forma maacutes pintoresca ldquopmos a los residuos hasta hacerlos hablarrdquo

Si observamos los residuos presentados en la figura 13-11 vemos que los primeros cincoson positivos De modo que para los vendedores tenemos Y ndash Y ˆ Ͼ 0 o Y Ͼ Y ˆ es decir laregresioacuten cae abajo de estos cinco puntos Tres de los cuatro uacuteltimos residuos son negaticonsiguiente para las vendedoras tenemos Y Ϫ Y ˆ Ͻ 0 o Y Ͻ Y ˆ asiacute que la recta de regresicuentra arriba de tres de los cuatro puntos Esto confirma lo que vimos al observar el diagdispersioacuten de la figura 13-9 Este patroacuten no aleatorio en los residuos sugiere que el sexo siacute etor determinante del salario base

iquestCoacutemo podemos incorporar el sexo de los vendedores dentro del modelo de regresioacutencemos utilizando un dispositivo llamado variable ficticia (o variable indicadora) Para lpuntos que representan a los vendedores esta variable tiene valor de 0 y para los cuatro purepresentan a las vendedoras valdraacute 1 Los datos de entrada para nuestra regresioacuten con variticias se dan en la tabla 13-6

Para los datos de la tabla 13-6 se ajusta una regresioacuten de la forma

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

Uso de variablesficticias

Deteccioacuten depatrones en losresiduos

ldquoPresionar a losresiduosrdquo

Anaacutel i s i s de r e gr e s i oacuten

La ec uac i oacuten de r e gr es i oacuten esSALARI O ϭ 5 81 ϩ 0 233 MESES

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t pCons t a nt e 5 8093 0 4038 14 39 0 000MESES 0 23320 0 02492 9 36 0 000

s ϭ 0 5494 R- s q ϭ 92 6

Anaacute l i s i s de va r i a nz aFUENTE GL SC MC F Re gr e s i oacuten 1 26 443 24 443 87 61 0Er r or 7 2 113 0 302Tot a l 8 28 556

FIGURA 13-10

Regresioacuten conMinitab del salariobase sobre losmeses deantiguumledad

RENGLOacuteN SALARI O AJ UST1 RESI 1

1 7 5 7 2085 0 2914992 8 6 8 1413 0 458684

3 9 1 8 6077 0 4922764 10 3 10 0069 0 2930545 13 0 12 8054 0 1946076 6 2 6 9753 - 0 7752977 8 7 8 8409 - 0 1409288 9 4 9 3073 0 0926649 9 8 10 7066 - 0 906558

FIGURA 13-11

Tabla de residuosde Minitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1256

tantes X 2 y X 3 se estima que 100 horas adicionales dedicadas a auditoriacuteas de campo descubri-raacuten $597000 adicionales de impuestos no pagados Observe que se redondearon los valoresproporcionados por la regresioacuten dada por Minitab (figura 13-2)

Suponga que en noviembre el IRS intenta dejar las horas de trabajo en auditoriacuteas de cam-po y las horas en computadora en sus niveles de octubre (4300 y 1500) pero decide aumen-tar las recompensas pagadas a los informantes a $75000 iquestCuaacutento de impuestos no pagadosesperan descubrir en noviembre Sustituyendo estos valores en la ecuacioacuten de regresioacuten esti-mada obtenemos

Y ˆ ϭ Ϫ45796 ϩ 0597 X 1 ϩ 1177 X 2 ϩ 0405 X 3

Y ˆ ϭ Ϫ45796 ϩ 0597(43) ϩ 1177(15) ϩ 0405(75)

Y ˆ ϭ Ϫ45796 ϩ 25671 ϩ 17655 ϩ 30375

Y ˆ ϭ 27905 larr Descubrimientos estimados $27905000

De modo que el departamento de auditoriacuteas espera descubrir aproximadamente $28 millonesde evasioacuten de impuestos en noviembre

2 Una medida de dispersioacuten el error estaacutendar de la estimacioacuten de la regresioacuten muacuteltiple Ya quehemos determinado la ecuacioacuten que relaciona a nuestras tres variables necesitamos una me-dida de la dispersioacuten alrededor de este plano de regresioacuten muacuteltiple En la regresioacuten simple laestimacioacuten es maacutes precisa conforme el grado de dispersioacuten alrededor de la regresioacuten es menorLo mismo es cierto para los puntos de la muestra que se encuentran alrededor del plano de re-gresioacuten muacuteltiple Para medir esta variacioacuten debemos utilizar de nuevo la medida conocida co-

mo error estaacutendar de la estimacioacuten

Medicioacuten de ladispersioacuten alrededordel plano de regre-sioacuten muacuteltiple usodel error estaacutendar dela estimacioacuten

Error estaacutendar de la estimacioacuten

se ϭ Ί [13-6]Y ndash Y ˆ )2ᎏᎏ

n Ϫ k Ϫ 1

donde

bull Y ϭ valores muestrales de la variable dependientebull Y ˆ ϭ valores correspondientes estimados con la ecuacioacuten de regresioacutenbull n ϭ nuacutemero de puntos de la muestrabull k ϭ nuacutemero de variables independientes (ϭ 3 en nuestro ejemplo)

El denominador de esta ecuacioacuten indica que en la regresioacuten muacuteltiple con k variables in-

dependientes el error estaacutendar tiene n Ϫ k Ϫ 1 grados de libertad Esto se debe a que los

grados de libertad se reducen de n en k ϩ 1 constantes numeacutericas a b1 b2 hellip b k que se

estimaron a partir de la misma muestra

Para calcular se observamos los errores individuales (Y Ϫ Y ˆ ) en el plano de regresioacuten ajus-tado los elevamos al cuadrado calculamos su media (dividiendo entre n Ϫ k Ϫ 1 en lugar den) y tomamos la raiacutez cuadrada del resultado Debido a la forma en que se calcula se se cono-ce a veces como raiacutez del error cuadraacutetico medio [o raiacutez de mse (mean-square error)] De lasalida de Minitab que usa s en lugar de se para denotar el error estaacutendar vemos que la raiacutez demse en el problema del Servicio Interno de Contribuciones es 0286 es decir $286000

Como en el caso de la regresioacuten simple podemos utilizar el error estaacutendar de la estimacioacuteny la distribucioacuten t para formar un intervalo de confianza alrededor de nuestro valor estimadoY ˆ En el problema de la evasioacuten de impuestospara 4300 horas de trabajo en auditoriacuteas de cam-po 1500 horas en computadora y $75000 de pago a informantes Y ˆ es $27905000 como es-timacioacuten de impuestos no pagados descubiertos y se es $286000 Si deseamos construir unintervalo de confianza del 95 alrededor de esta estimacioacuten de $27905000 miramos enla tabla 2 del apeacutendice en la columna del 5 y localizamos ahiacute el rengloacuten correspondiente a

Intervalos deconfianza para Y ˆ

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1356

n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad El valor apropiado de t para nuestracioacuten del intervalo es de 2447 En consecuencia podemos calcular los liacutemites de nutervalo de confianza como sigue

Y ˆ ϩ t (se) ϭ 27905000 ϩ (2447)(286000)

Y ˆ ϩ t(se) ϭ 27905000 ϩ 699800

Y ˆ ϩ t(se) ϭ 28604800 larr Liacutemite superior

Y ˆ Ϫ t (se) ϭ 27905000 Ϫ (2447)(286000)

Y ˆ ϩ t(se) ϭ 27905000 ndash 699800

Y ˆ ϩ t(se) ϭ 27205200 larr Liacutemite inferior

Con un nivel de confianza del 95 el departamento de auditoriacuteas puede sentirse sque los descubrimientos reales estaraacuten en este intervalo que va de $27205200 a $28Si el IRS desea usar un nivel de confianza menor como 90 puede reducir el intevalores para la estimacioacuten de descubrimientos de impuestos no pagados Igual que cgresioacuten simple podemos utilizar la distribucioacuten normal estaacutendar (tabla 1 del apeacutendaproximar la distribucioacuten t siempre que los grados de libertad (n menos el nuacutemero cientes de regresioacuten estimados) sea un nuacutemero mayor que 30

Al antildeadir la tercera variable independiente (recompensas a informantes) iquestmejoroacuteregresioacuten Como se mide la dispersioacuten de los datos alrededor del plano de regresioacutenmenores de se deberiacutean indicar mejores regresiones Para la regresioacuten de dos variablecimos con anterioridad en este mismo capiacutetulo se resultoacute ser 1076 Como al agregarra variable se se redujo a 0286 vemos que siacute mejoroacute el ajuste de la regresioacuten en este Sin embargo en general no es cierto que al agregar variables siempre se reduzc

3 El coeficiente de determinacioacuten muacuteltiple Al estudiar el anaacutelisis de correlacioacuten simpmos la fuerza de la relacioacuten entre dos variables utilizando el coeficiente de determinla muestra r 2 Este coeficiente de determinacioacuten es la fraccioacuten de la variacioacuten total riable dependiente Y que se explica con la ecuacioacuten de estimacioacuten

Similarmente en la correlacioacuten muacuteltiple mediremos la fuerza de la relacioacuten entre trbles utilizando el coeficiente de determinacioacuten muacuteltiple R

2 o su raiacutez cuadrada R (el cte de correlacioacuten muacuteltiple) Este coeficiente de determinacioacuten muacuteltiple es tambieacuten la

que representa la porcioacuten de la variacioacuten total de Y que ldquoexplicardquo el plano de regr

Note que la salida del programa da el valor 983 para R2 Esto nos dice que las tr

bles independientes explican el 983 de la variacioacuten total de impuestos no pagadobiertos Para la regresioacuten de dos variables hecha antes R2 es soacutelo 0729 asiacute que las trabajo en auditoriacutea de campo y las horas en computadora explican el 729 de la vaagregar las recompensas a los informantes explica el 254 restante de la variacioacuten

Todaviacutea no hemos explicado los nuacutemeros en las columnas etiquetadas con Desvciente t y p de la figura 13-2 Estos nuacutemeros se utilizaraacuten para hacer inferencias acercano de regresioacuten de la poblacioacuten tema que se trataraacute en la seccioacuten 13-4

Uso del coeficientede determinacioacutenmuacuteltiple

Valor de variablesadicionales

Interpretacioacuten delintervalo deconfianza

Ya nadie calcula regresiones a mano hayotras cosas maacutes interesantes en queacute ocu-par nuestro tiempo Se explicoacute la teacutecnicacalculando las soluciones a mano para

que no tenga que pensar en su computadora como en unaldquocaja negrardquo que hace muchas cosas uacutetiles que no puedeexplicar Sugerencia el valor real de usar la computadorapara calcular regresiones muacuteltiples es que puede manejarmuchas variables independientes y obtener una mejor ecua-

cioacuten de estimacioacuten que puede medir si agregar otrble independiente realmente mejora los resultados yposible observar con rapidez el comportamiento de

indica la proporcioacuten de la variacioacuten total de la variapendiente que se explica con las variables indepenLa computadora hace todo el trabajo tedioso mdashsin semdash y le deja tiempo para el trabajo maacutes importcomprender los resultados y usarlos para tomar mdecisiones

SUGERENCIASY

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1456

La ec uac i oacuten de r egr es i oacuten esY = - 12 75 + 17 1 X1 + 0 54 1 X2 - 0 17 4 X3

Pr onos t i c ador Coe f De s vEs t Coc i e nt e - t pCons t a n t e - 1275 2699 - 0 47 0 719X1 17 059 6 908 2 47 0 245X2 0 5406 0 3144 1 72 0 335X3 - 0 1743 0 1005 - 1 73 0 333

s = 396 1 R- s q = 87 2

b) iquestQueacute porcentaje de la variacioacuten total del nuacutemero de solicitudes urgentes de devolucioacuten de impuestosexplica esta ecuacioacuten

c) Para este antildeo el iacutendice econoacutemico es 169 la poblacioacuten residente en un radio de una milla desde la

oficina es 10212 habitantes y el ingreso promedio en Ithaca es $26925 iquestCuaacutentas solicitudes urgen-tes de devolucioacuten de impuestos debe Pam esperar procesar entre el 1 de marzo y el 15 de abril

Conceptos baacutesicos 13-14 Dado el siguiente conjunto de datos utilice el paquete de software que tenga disponible para encontrar la

ecuacioacuten de regresioacuten de mejor ajuste y responda a lo siguientea) iquestCuaacutel es la ecuacioacuten de regresioacutenb) iquestCuaacutel es el error estaacutendar de la estimacioacutenc) iquestCuaacutel es el valor de R

2 para esta regresioacutend) iquestCuaacutel es el valor pronosticado para Y cuando X 1 ϭ 58 X 2 ϭ 42 y X 3 ϭ 51

Y X 1 X 2 X 3

647 35 53 85809 74 16 26246 25 63 45439 37 94 88777 55 14 36206 83 92 25669 67 25 27343 12 22 13

Ejercicios 133

Ejercicios de autoevaluacioacuten

EA 13-3 Pam Schneider posee y opera un despacho de contadores en Ithaca Nueva York Ella piensa que seriacutea uacutetilpredecir el nuacutemero de solicitudes urgentes de devolucioacuten de impuestos que le pediraacuten durante el ajetrea-do periodo del 1 de marzo al 15 de abril para poder planear mejor sus necesidades de personal duranteesta eacutepoca Tiene la hipoacutetesis de que varios factores pueden ser uacutetiles para su pronoacutestico Los datos de es-tos factores y el nuacutemero de solicitudes urgentes de devolucioacuten de impuestos de antildeos pasados son

Y X 2 Nuacutemero de

Poblacioacuten solicitudesresidente X 3 de devolucioacuten

X 1 en un radio Ingreso urgentesIacutendice de una milla promedio (1 de marzo

econoacutemico desde la oficina en Ithaca a 15 de abril)

99 10188 21465 2306106 8566 22228 1266100 10557 27665 1422129 10219 25200 1721179 9662 26300 2544

a) Use el siguiente resultado de Minitab para determinar la ecuacioacuten de regresioacuten maacutes adecuada para es-

tos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1556

13-15 Dado el siguiente conjunto de datos utilice el paquete de software que tenga a su disposicioacuten patrar la ecuacioacuten de regresioacuten de mejor ajuste y responda a lo siguientea) iquestCuaacutel es la ecuacioacuten de regresioacutenb) iquestCuaacutel es el error estaacutendar de la estimacioacutenc) iquestCuaacutel es el valor de R2 para esta regresioacutend) Deacute un intervalo de confianza para la estimacioacuten del 95 para el valor Y cuando los valores X

y X 4 son 524 416 358 y 3 respectivamente

X 1 X 2 X 3 X 4 Y

214 629 219 Ϫ2 228

517 407 429 5 937418 818 698 2 649

118 410 909 Ϫ4 192

716 226 129 8 558

919 615 309 1 231

Aplicaciones

1316 Las estaciones de policiacutea en Estados Unidos estaacuten interesadas en predecir el nuacutemero de arrestodos que deberaacuten procesar cada mes para programar mejor a los empleados de oficina En los daricos el nuacutemero promedio de arrestos (Y ) cada mes tiene influencia del nuacutemero de oficiales en

policiaca ( X 1) la poblacioacuten de la ciudad en miles ( X 2) y el porcentaje de personas desempleadasdad en miles ( X 3) Los datos de estos factores en 15 ciudades se presentan en la tablaa) Utilice el paquete de software que tenga disponible para determinar la ecuacioacuten de regresioacuten

jor se ajuste a estos datosb) iquestQueacute porcentaje de la variacioacuten total en el nuacutemero de arrestos (Y ) explica esta ecuacioacutenc) El departamento de policiacutea de ChapelBoro desea pronosticar el nuacutemero de arrestos mensua

pelBoro tiene una poblacioacuten de 75000 habitantes 82 elementos en su fuerza policiaca y utaje de desempleo del 105 iquestCuaacutentos arrestos pronostica para cada mes

Nuacutemero promedio Nuacutemero de oficiales Tamantildeo de la ciudad (X 2) Porcende arrestos mensuales (Y ) en la fuerza (X 1) en miles de habitantes desemp

3906 68 816 4

5043 94 751 3

6284 125 973 5

7456 175 1235 8

5852 113 1184 11

4503 82 654 9

3278 46 616 12

2605 32 543 18

4775 89 974 4

3898 67 824 6

3124 47 564 8

3675 59 713 7

3744 61 674 9

4946 87 963 11

4875 92 864 4

13-17 Estamos intentando predecir la demanda anual (DEMAND) de cierto producto utilizando las svariables independientes

PRECIO ϭ precio del producto (en doacutelares)

INGRESO ϭ ingreso del consumidor (en doacutelares)

SUB ϭ precio de un bien sustituto (en doacutelares)

( Nota Un bien sustituto es aquel que puede suplir a otro bien Por ejemplo la margarina es untituto de la mantequilla)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1656

Se recolectaron datos correspondientes al periodo 1982-1996

Antildeo Demanda Precio ($) Ingreso ($) Sub ($)

1982 40 9 400 101983 45 8 500 141984 50 9 600 121985 55 8 700 131986 60 7 800 111987 70 6 900 151988 65 6 1000 161989 65 8 1100 17

1990 75 5 1200 221991 75 5 1300 191992 80 5 1400 201993 100 3 1500 231994 90 4 1600 181995 95 3 1700 241996 85 4 1800 21

a) Utilice el paquete de software que tenga disponible para encontrar la ecuacioacuten de regresioacuten ajuste para estos datos

b) iquestSon los signos (ϩ o Ϫ) de los coeficientes de regresioacuten de las variables independientes los qperan Deacute una explicacioacuten breve ( Nota Eacutesta no es una pregunta estadiacutestica soacutelo necesita pesignifican los coeficientes de regresioacuten)

c) Establezca e interprete el coeficiente de determinacioacuten muacuteltiple del problemad) Establezca e interprete el error estaacutendar de la estimacioacuten para el problemae) Seguacuten la ecuacioacuten de regresioacuten obtenida iquestqueacute valor de DEMAND predeciriacutea si el precio de

ductos fue $6 el ingreso del consumidor $1200 y el precio del bien sustituto $17 13-18 Bill Buxton profesor de estadiacutestica de una prominente escuela de administracioacuten tiene un prof

tereacutes en los factores que afectan el desempentildeo de los estudiantes en los exaacutemenes El examen psemestre anterior tuvo una distribucioacuten de calificaciones amplia pero Bill tiene la certeza de qfactores explican esa distribucioacuten permite a sus estudiantes que estudien en tantos libros comoca el coeficiente de inteligencia de los estudiantes variacutea tienen distintas edades y difieren losque dedican a estudiar Con el propoacutesito de desarrollar una foacutermula de prediccioacuten para las califde los exaacutemenes Bill pidioacute a cada estudiante que respondiera al final del examen preguntas refe

tiempo de estudio y nuacutemero de libros utilizados Los registros que teniacutea Bill ya incluiacutean el coefiinteligencia y la edad de modo que reunioacute los datos del grupo y corrioacute la regresioacuten muacuteltiple deLa salida de la corrida de Bill fue la siguiente

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t Con s t a nt e minus49 948 41 55 minus1 20 0HORAS 1 06931 0 98163 1 09 0CI 1 36460 0 37627 3 63 0LI BROS 2 03982 1 50799 1 35 0EDAD minus1 79890 0 67332 minus2 67 0

s = 11 657 R- s q = 76 7

a) iquestCuaacutel es la ecuacioacuten de regresioacuten de mejor ajuste para estos datos

b) iquestQueacute porcentaje de la variacioacuten en las calificaciones se explica con esta ecuacioacutenc) iquestQueacute calificacioacuten esperariacutea usted para un estudiante de 21 antildeos de edad con un coeficiente gencia (CI) de 113 que estudioacute durante cinco horas y utilizoacute tres libros diferentes

13-19 La compantildeiacutea de tiendas de abarrotes Twenty-Two estaacute planeando expandir su cadena Como ayudleccionar los lugares donde abriraacute las nuevas tiendas recolectoacute datos de las ventas semanales de casus 23 tiendas Para explicar la variabilidad de las ventas semanales tambieacuten reunioacute informacioacutencribe cuatro variables que se cree estaacuten relacionadas con las ventas Las variables se definen como

VENTAS ϭ ventas semanales promedio en cada tienda en miles de doacutelares

AUTOS ϭ volumen promedio de traacutensito de automoacuteviles por semana en miles de autos

ENTRADA ϭ facilidad de entradasalida medida en una escala de 1 a 100

INGANUAL ϭ ingreso anual promedio por familia en el aacuterea en miles de doacutelares

DISTANCIA ϭ distancia en millas desde la tienda al supermercado maacutes cercano

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1756

Los datos se analizaron con Minitab y la salida es la siguiente

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t Cons t a nt e 175 37 92 62 1 89 0 0AUTOS - 0 028 0 315 minus0 09 0 9ENTRADA 3 775 1 272 2 97 0 0I NGANUAL 1 990 4 510 0 44 0 6DI STANCI A 212 41 28 090 7 56 0 0

s = 85 587 R- s q = 95 8

a) iquestCuaacutel es la ecuacioacuten de regresioacuten de mejor ajuste dada por Minitab

b) iquestCuaacutel es el error estaacutendar de la estimacioacuten para esta ecuacioacutenc) iquestQueacute fraccioacuten de la variacioacuten en las ventas se explica con esta regresioacutend) iquestQueacute ventas predeciriacutea para una tienda localizada en un vecindario que tuvo un ingreso anu

milia de $20000 estaba a 2 millas del supermercado maacutes cercano se encontraba en una calvolumen promedio semanal de traacutensito de 100000 autos y con una facilidad de entrada de

13-20 Rick Blackburn estaacute pensando en vender su casa Con el fin de decidir el precio que pediraacute poreunido datos de 12 ventas recientes Registroacute el precio de venta (en miles de doacutelares) el nuacutemercuadrados de construccioacuten (en cientos de pies cuadrados) el nuacutemero de pisos el nuacutemero de bantiguumledad de la casa (en antildeos)

Precio de venta Pies cuad Pisos Bantildeos Antiguumledad

4965 89 1 10 2

6795 95 1 10 68115 126 2 15 11

8160 129 2 15 8

9150 190 2 10 22

9525 176 1 10 17

10035 200 2 15 12

10425 206 2 15 11

11265 205 1 20 9

14970 251 2 20 8

16065 227 2 20 18

23250 408 3 40 12

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de

de mejor ajuste para los datosb) iquestCuaacutel es el valor de R2 para esta ecuacioacutenc) Si la casa de Rick tiene 1800 pies cuadrados (ϭ 180 cientos de pies cuadrados) un piso

y seis antildeos de antiguumledad iquestqueacute precio de venta puede esperar Rick 13-21 La Allegheny Steel Corporation ha estado buscando los factores que influyen en la cantidad de

millones de toneladas) que puede vender cada antildeo La administracioacuten sospecha que los siguientfactores principales la tasa anual de inflacioacuten del paiacutes el precio promedio por tonelada del acetado que acota los precios (en doacutelares) de Allegheny y el nuacutemero de automoacuteviles (en millonesfabricantes de autos de Estados Unidos planean producir ese antildeo Se recolectaron los datos de losiete antildeos

Y X 2 X 3

Millones X 1 Cota de Nuacutemero

de tons Tasa de importa- deAntildeo vendidas inflacioacuten ciones automoacuteviles

1993 42 31 310 62

1992 31 39 500 51

1991 40 75 220 57

1990 47 107 450 71

1989 43 155 435 65

1988 37 130 260 61

1987 35 110 305 59

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1856

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de regresioacutende mejor ajuste para los datos

b) iquestQueacute porcentaje de la variacioacuten total de la cantidad de acero vendido (en millones de toneladas) porAllegheny cada antildeo explica esta ecuacioacuten

c) iquestCuaacutentas toneladas de acero deberaacute esperar Allegheny vender en un antildeo en el que la tasa de inflacioacutenes 71 los fabricantes de automoacuteviles norteamericanos planean producir 60 millones de autos y la co-ta promedio del acero importado por tonelada es $350

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-3 De la salida del paquete de software se obtienen los siguientes resultadosa) Y ˆ ϭ Ϫ1275 ϩ 17059 X 1 ϩ 05406 X 2 Ϫ 01743 X 3b) R

2ϭ 872 el modelo explica el 872 de la variacioacuten total en Y

c) Y ˆ ϭ Ϫ1275 ϩ 17059(169) ϩ 05406(10212) Ϫ 01743(26925) ϭ 2436 reembolsos de impuestos

134 Inferencias sobre paraacutemetrosde poblacioacuten

En el capiacutetulo 12 se vio que la recta de regresioacuten de la muestra Y ˆ ϭ a ϩ bX (ecuacioacuten 12-3) esti-maba la recta de regresioacuten de la poblacioacuten Y ϭ A ϩ BX (ecuacioacuten 12-13) La razoacuten por la cual soacute-lo podiacuteamos estimar la recta de regresioacuten de poblacioacuten y no determinarla con exactitud era que los

puntos no caen exactamente en la recta de regresioacuten de la poblacioacuten Debido a las variaciones alea-torias los puntos satisfaciacutean Y ϭ A ϩ BX ϩ e (ecuacioacuten 12-13a) maacutes que a Y ϭ A ϩ BX

En la regresioacuten muacuteltiple se tiene justo la misma situacioacuten Nuestro plano de regresioacuten estimado

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k [13-5]

es una estimacioacuten de un plano de regresioacuten de poblacioacuten verdadero pero desconocido de la forma

Plano de regresioacutende la poblacioacuten

De nuevo los puntos individuales normalmente no caen con exactitud en el plano de regresioacuten depoblacioacuten Consideremos el problema del Servicio Interno de Contribuciones para ver por queacute Notodos los pagos a informantes tendraacuten la misma efectividad Algunas horas en computadora podriacuteanutilizarse para recolectar y organizar datos otras para analizar esos datos en busca de errores y frau-des El eacutexito de la computadora en descubrir impuestos no pagados puede depender de cuaacutento tiempose dedique a cada una de estas actividades Por eacutestas y otras razones algunos de los puntos se en-contraraacuten arriba del plano de regresioacuten y algunos estaraacuten abajo de eacuteste En lugar de satisfacer laecuacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

los puntos individuales satisfaraacuten la ecuacioacuten

Las variaciones alea-torias desplazan lospuntos del plano deregresioacuten

Ecuacioacuten de regresioacuten de la poblacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

Plano de regresioacuten de la poblacioacuten maacutes la variacioacuten aleatoria

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e [13-7a]

La cantidad e que aparece en la ecuacioacuten 13-7a es una variacioacuten aleatoria que en promedio es iguala cero La desviacioacuten estaacutendar de las variaciones individuales e y el error estaacutendar de la estima-cioacuten se que estudiamos en la seccioacuten anterior es una estimacioacuten de e

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1956

Como nuestro plano de regresioacuten de la muestra Y ˆ ϭ a ϩ b1X1 ϩ b2 X 2 ϩ ϩ bk X k (ecuaci13-7) estima el plano de regresioacuten de poblacioacuten desconocido Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk

(ecuacioacuten 13-7) deberemos ser capaces de usarlo para hacer inferencias sobre el plano de regreside la poblacioacuten En esta seccioacuten haremos inferencias acerca de las pendientes ( B1 B2 Bk ) deecuacioacuten de regresioacuten ldquoverdaderardquo (la que se aplica a la poblacioacuten completa) basadas en las pendietes (b1 b2 bk ) de la ecuacioacuten de regresioacuten estimada a partir de la muestra de datos

Inferencias acerca de una pendiente individual B i El plano de regresioacuten se deriva de una muestra y no de la poblacioacuten completa Como resultado

podemos esperar que la ecuacioacuten de regresioacuten verdadera Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k que se aplica a la poblacioacuten completa) sea exactamente igual que la ecuacioacuten estimada a partir observaciones de la muestra Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k Sin embargo podemos utilizarvalor de bi una de las pendientes que calculamos a partir de la muestra para probar hipoacutetesis acca del valor de Bi una de las pendientes del plano de regresioacuten para la poblacioacuten completa

El procedimiento para probar una hipoacutetesis respecto a Bi es parecido al procedimiento analizaen los capiacutetulos 8 y 9 sobre pruebas de hipoacutetesis Para entender este proceso regresemos al probma que relaciona los impuestos no pagados descubiertos con las horas de trabajo en auditoriacuteas campo horas en computadora y recompensas a informantes En la paacutegina 729 sentildealamos que b10597 El primer paso consiste en encontrar un valor para B1 y compararlo con b1 ϭ 0597

Suponga que durante un periodo largo la pendiente de la relacioacuten entre Y y X 1 fue 0400 Paprobar si todaviacutea es vaacutelida podriacuteamos definir las hipoacutetesis como

H0 B1 ϭ 0400 larr Hipoacutetesis nula

H1 B1 0400 larr Hipoacutetesis alternativa

De hecho realizamos la prueba para saber si los datos actuales indican que B1 ha cambiado su vahistoacuterico de 0400

Para encontrar el estadiacutestico de prueba para B1 es necesario hallar primero el error estaacutendar d

coeficiente de regresioacuten El coeficiente de regresioacuten con el que estamos trabajando es b1 de moque el error estaacutendar de este coeficiente se representa con sb1

Resulta demasiado difiacutecil calcular sb1 a mano pero por fortuna Minitab calcula los errores estaacutedar de todos los coeficientes de regresioacuten Por comodidad repetimos la figura 13-2 Los errores taacutendar de los coeficientes se dan en la columna DesvEst de la salida de Minitab

En el cuadro de salida vemos que sb1

es 00811 (Similarmente si deseamos probar una hipoacutesis acerca de B2 vemos que el error estaacutendar apropiado que debemos utilizar es sb2 ϭ 00841) Uvez que encontramos sb1 en la salida de Minitab podemos usar la ecuacioacuten 13-8 para estandarizarpendiente de nuestra ecuacioacuten de regresioacuten ajustada

Estandarizacioacutendel coeficiente deregresioacuten

Error estaacutendar delcoeficientede regresioacuten

Prueba de unahipoacutetesis acerca de B i

Diferencia entre la

ecuacioacuten de regre-sioacuten verdadera y unaestimada a partir delas observacionesde la muestra

Coeficiente de regresioacuten estandarizado

t ϭ [13-8bi ndash Bi0ᎏ

sbi

donde

bull biϭ pendiente de la regresioacuten ajustada

bull Bi0 ϭ pendiente real hipoteacutetica para la poblacioacutenbull sbi ϭ error estaacutendar del coeficiente de regresioacuten

iquestPor queacute utilizamos t para denotar el estadiacutestico estandarizado Recuerde que en la regresioacuten siple utilizamos a y b en la ecuacioacuten 12-7 para calcular se y que se estimaba e la desviacioacuten estaacutedar de las variaciones de los datos (ecuacioacuten 12-13a) Entonces utilizamos se en la ecuacioacuten 12-para encontrar sb el error estaacutendar del coeficiente de regresioacuten que corresponde a la pendiente E

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2056

pezamos con n puntos y los usamos para estimar los dos coeficientes a y b Luego basamtras pruebas en la distribucioacuten t con n Ϫ 2 grados de libertad

De manera similar en la regresioacuten muacuteltiple tambieacuten empezamos con n puntos pero lospara estimar k ϩ 1 coeficientes la ordenada a y k pendientes b1 b2 bk Despueacutes estcientes se usan en la ecuacioacuten 13-6 para calcular se que de nuevo es una estimacioacuten de eviacioacuten estaacutendar de las variaciones de los datos (ecuacioacuten 13-7a) Luego se utiliza se (en ucioacuten que estaacute maacutes allaacute del alcance de este libro) para encontrar s

bi Debido a lo anterior

nuestras pruebas de hipoacutetesis en la distribucioacuten t con n Ϫ k Ϫ 1 (ϭ n Ϫ ( k ϩ l)) grados de En nuestro ejemplo el valor estandarizado del coeficiente de regresioacuten es

t ϭ

ϭ

ϭ 2432 larr Coeficiente de regresioacuten estandarizado

Suponga que estamos interesados en probar nuestras hipoacutetesis al nivel de significancia

Como tenemos 10 observaciones en la muestra y tres variables independientes sabemos n Ϫ k Ϫ 1 o 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad Buscamos en la tabla 2 del apeacutendice en lana de 10 y el rengloacuten de 6 grados de libertad Ahiacute vemos que el valor apropiado de t es 19mo nos preocupa si b1 (la pendiente del plano de regresioacuten de la muestra) es significativamferente de B1 (la pendiente hipoteacutetica del plano de regresioacuten de la poblacioacuten) eacutesta es una pdos colas y los valores criacuteticos son Ϯ1943 El coeficiente de regresioacuten estandarizado es 2se encuentra fuera de la regioacuten de aceptacioacuten de nuestra prueba de hipoacutetesis Por consiguichazamos la hipoacutetesis nula de que B1 todaviacutea es igual a 0400 En otras palabras existe unacia suficientemente grande entre b1 y 0400 para concluir que B1 ha cambiado respecto a histoacuterico Por esto sentimos que cada 100 horas adicionales de trabajo en auditoriacuteas de camaumentan la cantidad de descubrimientos de impuestos no pagados en $400000 como lo hel pasado

Ademaacutes de la prueba de hipoacutetesis podemos construir un intervalo de confianza para cude los valores de Bi Del mismo modo que bi es una estimacioacuten puntual de Bi estos intervalofianza son estimaciones de intervalo de Bi Para ilustrar el proceso de construccioacuten de interconfianza encontremos un intervalo de confianza del 95 para B3 en el ejemplo del IRS Lrelevantes son

b3 ϭ 0405 de la figura 13-2sb3 ϭ 00422

t ϭ 2447 larr Nivel de significancia del 5 y 6 grados de libertad

Intervalo deconfianza para B i

Realizacioacuten de la

prueba de hipoacutetesis

0597 ndash 0400ᎏᎏ

0081

b1 ndash B10ᎏ

sb1

Anaacute l i s i s de r e gr e s i oacutenLa ec uaci oacuten de r egr es i oacuten esDESCUBRE = - 45 0 + 0 597 AUDI TORIacute A + 1 18 COMPUTADORA + 0 405 RECOMPENSA

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 45 796 4 878 - 9 39 0 000AUDI TORIacute A 0 50697 0 08112 7 36 0 000COMPUTADORA 1 17684 0 08407 14 00 0 000RECOMPENSAS 0 40511 0 04223 9 59 0 000

s = 0 2861 R- s q = 98 3

FIGURA 13-2

Salida de Minitab(figura repetida)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2156

Con esta informacioacuten podemos calcular el intervalo de confianza de la siguiente manera

b3 ϩ t (sb3) ϭ 0405 ϩ 2447(00422)

ϭ 0508 larr Liacutemite superior

b3 Ϫ t (sb3) ϭ 0405 Ϫ 2447(00422)

ϭ 0302 larr Liacutemite inferior

Vemos que podemos tener una seguridad del 95 de que cada $1000 adicionales pagados a los formantes aumenta el descubrimiento de impuestos no pagados en una cantidad entre $302000$508000

A menudo estaremos interesados en preguntas del tipo iquesten realidad Y depende de X i Por ejeplo podriacuteamos preguntar si descubrir impuestos no pagados en realidad depende de las horas encomputadora Con frecuencia esta pregunta se plantea como iquestes X i una variable explicativa sigficativa de Y Si piensa un poco maacutes se convenceraacute de que si Bi 0 Y depende de las X i (esto esvariacutea cuando X i variacutea) y no depende de X i si Bi ϭ 0

Vemos que nuestra pregunta conduce a establecer hipoacutetesis de la forma

H0 Bi ϭ 0 larr Hipoacutetesis nula X i no es una variable explicativa significativa

H1 Bi 0 larr Hipoacutetesis alternativa X i es una variable explicativa significativa

Podemos probar estas hipoacutetesis utilizando la ecuacioacuten 13-8 del mismo modo que cuando probamnuestras hipoacutetesis acerca de si B1 todaviacutea era igual a 0400 Sin embargo existe una forma maacutes faacutede hacerlo usando la columna de la figura 13-2 de ldquocociente- t rdquo Observemos de nuevo la ecuaci13-8

t ϭ [13-

Como nuestro valor hipoteacutetico de Bi es cero el valor estandarizado del coeficiente de regresioacutedenotado por t o se convierte en

t o ϭ

El valor de t o se conoce como valor t ldquocalculadordquo Eacuteste es el nuacutemero que aparece en la columna equetada como ldquocociente-t rdquo en la figura 13-2 Denotemos por t c el valor t ldquocriacuteticordquo que buscamos

la tabla 2 del apeacutendice Entonces como la prueba para determinar si X i es una variable explicatisignificativa es una prueba de dos colas soacutelo necesitamos verificar si Ϫt c Յ t o Յ t c

Uso de valores t

calculados en lasalida de Minitab

biᎏ

sbi

bi ndash Bi0ᎏ

sbi

iquestEs significativa unavariable explicativa

Prueba para determinar si una variable es o no significativa

Ϫt c Յ t o Յ t c [13-9

donde

bull t c ϭ valor t adecuado (con n Ϫ k Ϫ 1 grados de libertad) para el nivel de significancia deprueba

bull t o ϭ bi sbi ϭ valor t observado (o calculado) obtenido con el paquete de software

Si t o

cae entre Ϫt c

y t c aceptamos H0 y llegamos a la conclusioacuten de que X

ino es una variable exp

cativa significativa En cualquier otro caso rechazamos H0 y concluimos que X i es una variable eplicativa significativa

Probemos al nivel de significancia de 001 si las horas en computadora constituyen una variabexplicativa significativa para los impuestos no pagados descubiertos De la tabla 2 del apeacutendice cn Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad y ϭ 001 vemos que t c ϭ 3707 De la figura 13tenemos que t o = 1400 Como t o Ͼ t c concluimos que el tiempo en computadora es una variab

Prueba de lasignificancia de lavariable horas decomputadora en elproblema del IRS

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2256

explicativa significativa De hecho al observar los valores t calculados para las otras dos vindependientes (tiempo de auditoriacuteas de campo t o ϭ 736 y recompensa a informantes t ovemos que tambieacuten son variables explicativas significativas

Podemos tambieacuten utilizar la columna de ldquoprdquo para probar si X i es una variable explicativacativa De hecho utilizando esa informacioacuten ni siquiera necesitamos usar la tabla 2 del aLos elementos de esta columna son los valores prob para las hipoacutetesis

H0 Biϭ 0

H1 Bi 0

Recuerde del anaacutelisis hecho en el capiacutetulo 9 que estos valores prob constituyen la probabque cada bi esteacute tan lejos de cero como (o maacutes) el valor observado obtenido de la regresioacutenverdadera Como se ilustra en la figura 13-3 solamente necesitamos comparar estos valocon el nivel de significancia de la prueba para determinar si X i es o no una variable expsignificativa para Y

Probar la significancia de una variable explicativa es siempre una prueba de dos colas Lble independiente X i es una variable explicativa significativa si bi es significativamente dife

cero es decir si t o es un nuacutemero grande positivo o negativoPara el ejemplo del IRS repetimos las pruebas con ϭ 001 Para cada una de las tres v

independientes p es menor que 001 de forma que podemos concluir que cada una de ellanificativa

Inferencias acerca de la regresioacuten como un todo

(usando una prueba F )

Suponga que cubre con papel un tablero para dardos y lanza varios dardos sobre eacutel Despueacuteberlo hecho tendraacute algo muy parecido a un diagrama de dispersioacuten Suponga entonces quuna recta de regresioacuten a este conjunto de ldquopuntos observadosrdquo y calcula r

2 Debido a que lofueron lanzados aleatoriamente usted espera obtener un valor bajo de r

2 puesto que en esten realidad no explica a Y Sin embargo si hace esto muchas veces ocasionalmente observalor alto de r

2 por pura casualidadDada cualquier regresioacuten simple (o muacuteltiple) es natural preguntarse si el valor de r2 (

realmente indica que las variables independientes explican a Y o si esto sucede por cas

A menudo esta interrogante se plantea de la siguiente manera iquestla regresioacuten como un todo ficativa En la uacuteltima seccioacuten vimos coacutemo decidir si una X i individual es una variable exp

Significancia de laregresioacuten comoun todo

FIGURA 13-3

Uso de ldquoprdquo paradeterminar si X i esuna variable expli-cativa significativa

Regioacuten de aceptacioacuten Regioacuten de aceptacioacuten

2 del aacuterea

2 del aacuterea

2 del aacuterea

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

ndasht c

ndasht o

t o

t c

0

(a) p es mayor que X

i no es una variable

explicativa significativa

(b) p es menor que X

i es una variable

explicativa significativa

ndasht o

ndasht c

t c

0

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2356

significativa ahora veremos coacutemo decidir si todas las X i tomadas en conjunto explican significavamente la variabilidad observada de Y Nuestras hipoacutetesis son

H0 B1 ϭ B2 ϭ ϭ Bk ϭ 0 larr Hipoacutetesis nula Y no depende de las X i

H1 por lo menos una Bi 0 larr Hipoacutetesis alternativa Y depende de al menos una de las X i

Cuando analizamos r 2 en el capiacutetulo 12 consideramos la variacioacuten total en Y sum(Y Ϫ Y ෆ )2 la p

te de dicha variacioacuten que explica la regresioacuten sum(Y ˆ Ϫ Y ෆ )2 y la parte no explicada de la variacioacutensum(Y Ϫ Y ˆ )2 La figura 13-4 es un duplicado de la figura 12-15 Sirve como repaso de la relacioacuten etre la desviacioacuten total la desviacioacuten explicada y la desviacioacuten no explicada para un solo dato en uregresioacuten simple Aunque no podamos dibujar una figura similar para una regresioacuten muacuteltiple coceptualmente estamos haciendo lo mismo

Al analizar la variacioacuten en Y fijamos nuestra atencioacuten en tres teacuterminos diferentes cada uno de cuales es una suma de cuadrados Los denotamos con

Suma de cuadradosy sus grados delibertad

Anaacutelisis de lavariacioacuten de losvalores Y

FIGURA 13-4

Desviacioacuten totaldesviacioacutenexplicada ydesviacioacuten noexplicada paraun valor observadode Y

Y

X

Un valor observado de lavariable dependiente (Y )

R e c t a d

e r e g r e s

i oacute n

Desviacioacuten no explicada de esta Y respectoa su media Y

(Y ndash Y )^

Desviacioacuten explicada deesta Y respecto a su media Y

(Y ndash Y )^Y

Valor estimado de esta Y

a partir de la recta de regresioacuten (Y )^

Desviacioacuten total de esta Y

respecto a su media Y

(Y ndash Y )

Tres sumas de cuadrados

SCT ϭ suma de cuadrados total (es decir la parte explicada) ϭ sum(Y Ϫ Y ෆ )2

SCR ϭ suma de cuadrados de la regresioacuten (es decir la parte explicada) ϭ sum(Y ˆ Ϫ Y ෆ )2 [13-10

SCE ϭ suma de cuadrados del error (es decir la parte no explicada) ϭ sum(Y Ϫ Y ˆ )2

Estaacuten relacionadas por la ecuacioacuten

que dice que la variacioacuten total en Y puede dividirse en dos partes la parte explicada y la no explicaCada una de estas sumas de cuadrados tiene un nuacutemero asociado de grados de libertad SCT t

ne n Ϫ 1 grados de libertad (n observaciones menos un grado de libertad debido a que la media la muestra estaacute fija) SCR tiene k grados de libertad porque existen k variables independientes qse utilizaron para explicar Y Finalmente SCE tiene n Ϫ k Ϫ 1 grados de libertad porque utilizamnuestras n observaciones para estimar k ϩ 1 constantes a b1 b2 bk Si la hipoacutetesis nula es ci

ta el cociente

Descomposicioacuten de la variacioacuten total de Y

SCT ϭ SCR ϩ SCE [13-1

Cociente F

F ϭ [13-12SCR k ᎏᎏ

SCE(n ndash k ndash 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2456

tiene una distribucioacuten F con k grados de libertad en el numerador y n Ϫ k Ϫ 1 grados de libel denominador Si la hipoacutetesis nula es falsa entonces el cociente tiende a ser maacutes grande qula hipoacutetesis nula es verdadera De modo que si el cociente F es demasiado grande (seguacuten lo na el nivel de significancia de la prueba y el valor apropiado de la tabla 6 del apeacutendice) rechH0 y concluimos que la regresioacuten como un todo es significativa

La figura 13-5 presenta la salida de Minitab para el problema del IRS Esta parte del rincluye los cocientes F calculados para la regresioacuten en ocasiones llamado anaacutelisis de v

(ANOVA) para la regresioacuten Probablemente se pregunte si esto tiene algo que ver con el anaacutelisrianza que estudiamos en el capiacutetulo 11 La respuesta es siacute Aunque no lo hicimos es posibletrar que el anaacutelisis de varianza visto en el capiacutetulo 11 tambieacuten contempla la variacioacuten total las observaciones alrededor de la gran media y la divide en dos partes una explicada por lascias entre los distintos grupos (que corresponde a lo que llamamos varianza entre columnas)

no explicada por dichas diferencias (que corresponde a la varianza dentro de columnas) Estcisamente anaacutelogo a lo que acabamos de hacer en la ecuacioacuten 13-11Para el problema del IRS vemos que SCR ϭ 29109 (con k ϭ 3 grados de libertad) SCE

(con n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad) y que

F ϭ ϭ ϭ 11833

Los elementos en la columna ldquoMCrdquo son justo las sumas de cuadrados divididas entre sus glibertad Para 3 grados de libertad en el numerador y 6 en el denominador la tabla 6 del apeacutence que 978 es el liacutemite superior de la regioacuten de aceptacioacuten para un nivel de significancia El valor calculado de F 11833 estaacute muy por arriba de 978 de manera que se ve que la r

como un todo es altamente significativa Se puede llegar a la misma conclusioacuten si se observresultado del programa dice que ldquo prdquo es 0000 Debido a que este valor prob es menor que elsignificancia ϭ 001 se concluye que la regresioacuten completa es significativa De esta mapuede usar la p de ANOVA como prueba sin tener que utilizar la tabla 6 del apeacutendice para bvalor criacutetico de F Esto es anaacutelogo a la manera en que se usaron los valores de p en la figura ra probar la significancia de las variables explicativas individuales

Multicolinealidad en la regresioacuten muacuteltiple

En el anaacutelisis de regresioacuten muacuteltiple los coeficientes de regresioacuten a menudo se vuelven

confiables conforme aumenta el grado de correlacioacuten entre las variables independie

existe un alto nivel de correlacioacuten entre algunas de las variables independientes nos enfrenun problema que los estadiacutesticos llaman multicolinealidad

La multicolinealidad puede presentarse si deseamos estimar la recuperacioacuten de las ventaempresa y utilizamos tanto el nuacutemero de vendedores empleados como sus salarios totales Cvalores asociados con estas dos variables independientes tienen una correlacioacuten alta neceusar soacutelo un conjunto de ellos para realizar nuestra estimacioacuten De hecho al agregar una segriable que estaacute correlacionada con la primera se distorsionan los valores de los coeficientgresioacuten Sin embargo a menudo podemos predecir bien Y incluso cuando haya multicoline

Consideremos un ejemplo donde existe multicolinealidad para ver coacutemo afecta a la regresrante los 12 meses pasados el gerente del restaurante Pizza Shack ha estado poniendo unaanuncios en el perioacutedico local Los anuncios se programan y pagan el mes anterior a que ap

Un ejemplo demulticolinealidad

Definicioacuten y efecto dela multicolinealidad

9703ᎏ

0082

29109 3ᎏ

0491 6Prueba de lasignificancia de laregresioacuten en elproblema del Serviciode Contribuciones

Anaacutelisis devarianza parala regresioacuten

Prueba F de laregresioacuten como

un todo

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 29 1088 9 7029 118 52 0Er r or 6 0 4912 0 0819Tot al 9 29 6000

FIGURA 13-5Salida de Minitabanaacutelisis devarianza

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2556

Cada anuncio contiene un cupoacuten que permite llevarse dos pizzas pagando solamente la de mcio El gerente recolectoacute los datos de la tabla 13-4 y le gustariacutea utilizarlos para predecir las vpizzas

En las figuras 13-6 y 13-7 se dieron los resultados de Minitab para las regresiones respelas ventas totales sobre el nuacutemero de anuncios y sobre el costo

Para la regresioacuten sobre el nuacutemero de anuncios tenemos que el valor t observado es 395grados de libertad y un nivel de significancia de ϭ 001 se encontroacute que el valor t criacuteticdo de la tabla 2 del apeacutendice) es 3169 Como t o Ͼ t c (o de manera equivalente como p es m001) concluimos que el nuacutemero de anuncios es una variable explicativa altamente signifilas ventas totales Note tambieacuten que r 2 ϭ 610 de modo que el nuacutemero de anuncios explximadamente el 61 de la variacioacuten en las ventas de pizzas

Para la regresioacuten sobre el costo de los anuncios el valor t observado es 454 de modo qude los anuncios es una variable explicativa de las ventas totales todaviacutea maacutes significativa que ro de anuncios (para los que el valor t observado fue soacutelo 395) En esta regresioacuten r 2 ϭ 673

el costo de los anuncios explica aproximadamente el 67 de la variacioacuten de las ventas de pizComo ambas variables explicativas son altamente significativas por siacute mismas intentam

zar ambas en una regresioacuten muacuteltiple El resultado se presenta en la figura 13-8La regresioacuten muacuteltiple es altamente significativa como un todo ya que la p de ANOVA e

Uso de ambas varia-bles explicativas enuna regresioacuten muacuteltiple

Dos regresionessimples

Datos de ventas y anun-cios para el restaurantePizza Shack

Tabla 13-4 X 1 X 2 Y

Nuacutemero Costo de anuncios Venta tode anuncios publicados de pizz

Mes publicados (cientos de doacutelares) (miles de d

Mayo 12 139 436

Junio 11 120 380

Julio 9 93 301

Agosto 7 97 353

Septiembre 12 123 464

Octubre 8 114 342

Noviembre 6 93 302

Diciembre 13 143 407

Enero 8 102 385

Febrero 6 84 226

Marzo 8 112 376

Abril 10 111 352

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esVENTAS = 16 9 + 2 08 ANUNCI OS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 16 937 4 982 3 40 0 007ANUNCI OS 2 0832 0 5271 3 95 0 003

s = 4 206 R- s q = 61 0

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 1 276 31 276 31 15 62 Er r or 10 176 88 17 69Tot a l 11 453 19

Figura 13-6

Regresioacuten de lasventas sobre elnuacutemero deanuncios conMinitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2656

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2756

gar el nuacutemero de anuncios como segunda variable explicativa ademaacutes del costo de los anuncios eplica nada maacutes alrededor del 1 adicional de la variacioacuten de las ventas totales

En este punto es justo preguntarse iquestqueacute variable realmente explica la variacioacuten de las ventotales en la regresioacuten muacuteltiple La respuesta es que ambas la explican pero no podemos separ

sus contribuciones individuales debido a que estaacuten altamente correlacionadas entre siacute E

consecuencia sus coeficientes en la regresioacuten muacuteltiple tienen errores estaacutendar altos valore

calculados relativamente bajos y valores prob Ͼ | t | relativamente altos

iquestDe queacute manera nos afecta esta multicolinealidad Todaviacutea podemos hacer predicciones relativmente precisas cuando se encuentra presente note que para la regresioacuten muacuteltiple (la salida se dala figura 13-8) el error estaacutendar de la estimacioacuten que determina el ancho de los intervalos de co

fianza para las predicciones es 3989 mientras que para la regresioacuten simple con el costo de los anucios como variable explicativa (salida en la figura 13-7) tenemos se ϭ 3849 Lo que no podemhacer es predecir con mucha precisioacuten coacutemo cambiaraacuten las ventas si aumentamos en uno el nuacutemede anuncios La regresioacuten muacuteltiple dice que b1 ϭ 0625 (esto es cada anuncio aumenta las ventotales de pizzas alrededor de $625) pero el error estaacutendar de este coeficiente es 112 (es decir apximadamente $1120)

Las contribucionesindividuales nopueden separarse

Ejercicios 134

Ejercicios de autoevaluacioacuten

EA 13-4 Edith Pratt es una ocupada ejecutiva de una compantildeiacutea de transporte de carga a nivel nacional y va tara una junta porque no encuentra la salida de la regresioacuten muacuteltiple elaborada por un asistente Si la regsioacuten total es significativa al nivel 005 ella desea usar las salida de computadora como evidencia para fudamentar algunas ideas que expondraacute en la reunioacuten Sin embargo su ayudante estaacute enfermo De hectoda la informacioacuten que tiene de la regresioacuten muacuteltiple es un trozo de papel con los siguientes datos

Regresioacuten paraEdith Pratt

SCR 8724 con gl

SCE con 17 gl

SCT 10236 con 24 gl

Como el papel ni siquiera tiene todos los nuacutemeros Edith ha concluido que no es uacutetil Usted sin embardebe saber maacutes que ella iquestPuede Edith entrar en la junta o debe seguir buscando la salida de computador

EA 13-5 Una pequentildea liacutenea aeacuterea de Nueva Inglaterra realizoacute una encuesta sobre sus 15 terminales y obtuvo losguientes datos para el mes de febrero donde

VENTAS ϭ ingreso total seguacuten el nuacutemero de boletos vendidos (en miles de doacutelares)

PROMOCϭ cantidad gastada en promociones de la liacutenea aeacuterea en el aacuterea (en miles de doacutelares)

COMPET ϭ nuacutemero de liacuteneas aeacutereas que compiten en esa terminal

GRATIS ϭ nuacutemero de pasajeros que vuelan gratis (por diferentes razones)

Sugerencia el concepto de hacer infe-rencias respecto a una regresioacuten muacutelti-ple es justo lo mismo que se hizo en elcapiacutetulo 12 cuando hicimos inferencias

respecto a una recta de regresioacuten excepto que ahora se em-

plean dos o maacutes variables independientes Advertencia lamulticolinealidad es un problema que debe manejarse enla regresioacuten muacuteltiple y es necesario desarrollar una com-prensioacuten con sentido comuacuten Recuerde que todaviacutea puedehacer predicciones precisas cuando estaacute presente Pero re-cuerde tambieacuten que no puede decir con mucha precisioacuten

cuaacutento cambiaraacute la variable dependiente si ldquomanipulardquo lavariables independientes Entonces el objetivo debe seminimizar la multicolinealidad Sugerencia la mejor regresioacuten muacuteltiple es la que explica la relacioacuten entre los datos asentildealar la responsabilidad de la mayor proporcioacuten de la va

riacioacuten en la variable dependiente con el menor nuacutemero dvariables independientes Advertencia no es una buenidea incluir demasiadas variables independientes soacutelo porque cuenta con una computadora y un paquete de softwarpara estadiacutestica

SUGERENCIAS

Y

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2856

Ventas (doacutelares) Promoc (doacutelares) Compet Gratis

793 25 10 3

2001 55 8 6

1632 60 12 9

2001 79 7 16

1460 52 8 15

1777 76 12 9

309 20 12 8

2919 90 5 10

1600 40 8 43394 96 5 16

1596 55 11 7

863 30 12 6

2375 60 6 10

1072 50 10 4

1550 35 10 4

a) Utilice la siguiente salida de Minitab para determinar la ecuacioacuten de regresioacuten que mejor se ara la liacutenea aeacuterea

La ec uaci oacuten de r egr es i oacuten esVENTAS ϭ 172 ϩ 25 9 PROMOVϪ 13 2 COMPET Ϫ 3 04 GRATI S

Pr onos t i cador Coef Des vEs t Coci ent e - t Cons t ant e 172 34 51 38 3 35 0PROMOV 25 950 4 877 5 32 0COMPET - 13 238 3 686 - 3 59 0GRATI S - 3 041 2 342 - 1 30 0

b) iquestLos pasajeros que vuelan gratis ocasionan una disminucioacuten significativa en las ventas Fpruebe las hipoacutetesis apropiadas Use ϭ 005

c) iquestUn incremento de $1000 en las promociones cambia las ventas en $28000 o el cambio ecativamente diferente de $28000 Formule y pruebe las hipoacutetesis adecuadas Use ϭ 010

d) Calcule un intervalo de confianza del 90 para el coeficiente de la pendiente de la COMPET

Aplicaciones

13-22 Mark Lowtown publica el perioacutedico Mosquito Junction Enquirer y tiene problemas para predectidad de papel perioacutedico que necesita imprimir diariamente Eligioacute aleatoriamente 27 diacuteas del arior y registroacute la siguiente informacioacuten

PESO ϭ peso en libras de papel perioacutedico para la edicioacuten de ese diacutea

CLASIFICADOS ϭ nuacutemero de anuncios clasificados

PUBLICIDAD ϭ nuacutemero de anuncios publicitarios

PLANA COMPLETA ϭ nuacutemero de anuncios a una plana

Utilizando Minitab para hacer una regresioacuten de PESO sobre las otras tres variables Mark obtuguiente salida

Pr onos t i cador Coef Des vEs t Coci ent e- t Cons t ant e 1072 95 872 43 1 23 0CLASI FI CADOS 0 251 0 126 1 99 0PUBLI CI DAD 1 250 0 884 1 41 0PLANA COMPLETA 250 66 67 92 3 69 0

a) Mark siempre ha pensado que cada anuncio publicitario utiliza al menos 3 libras de papel iquestsioacuten le da una razoacuten significativa para dudar esto al nivel del 5

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2956

b) De manera similar Mark siempre ha creiacutedo que cada anuncio clasificado utiliza aproximmedia libra de papel iquestTiene ahora Mark una razoacuten significativa para dudar esto al nivel del

c) Mark vende espacios de anuncios de plana completa a los comerciantes locales a $30 la paacutegberaacute pensar en ajustar sus tarifas si el papel perioacutedico le cuesta $009 por libra Suponga costos son despreciables Establezca expliacutecitamente las hipoacutetesis y una conclusioacuten (Sugere

jando todo lo demaacutes constante cada anuncio adicional de plana completa tiene un costo de bras de papel ϫ $009 por libra ϭ $2256 El punto de equilibrio es 333333 libras iquestPor quel coeficiente de pendiente para PLANA COMPLETA es significativamente mayor que Mark no estaacute obteniendo ganancias y debe cambiar sus tarifas)

13-23 Para los datos del ejercicio 13-18 y un nivel de significancia de 010 iquestcuaacuteles variables son sign

mente explicativas de los resultados de los exaacutemenes (Habiacutea 12 estudiantes en la muestra) 13-24 Para los datos del ejercicio 13-18 y la siguiente salida de Minitab del procedimiento de regresiple hecho por Bill

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 3134 42 783 60Er r or 7 951 25 135 89Tot a l 11 4085 67

a) iquestCuaacutel es el valor observado de F b) A un nivel de significancia de 005 iquestcuaacutel es el valor criacutetico de F que se debe utilizar para d

si la regresioacuten como un todo es significativac) Basaacutendose en las respuestas a los incisos a) y b) iquestes la regresioacuten significativa como un tod

13-25 Remiacutetase al ejercicio 13-19 A un nivel de significancia de 001 iquestes la variable DISTANCIA uble explicativa significativa para VENTAS

13-26 Para los datos del ejercicio 13-19 y la siguiente salida adicional de Minitab al correr la regresioacuten

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 2861495 715374 102 39 0Er r or 18 125761 6896 7Tot a l 22 2987256

Al nivel de significancia de 005 iquestes la regresioacuten significativa como un todo

13-27 Henry Lander es el director de produccioacuten de la Alecos Corporation de Caracas Venezuela Hede que le ayude a determinar una foacutermula para predecir el ausentismo de los empacadores de chipoacutetesis es que la temperatura diaria promedio puede explicar el porcentaje de ausentismo Durios meses reuacutene datos ejecuta el procedimiento de regresioacuten simple y encuentra que la tempeplica 66 de la variacioacuten en el ausentismo Pero Henry no estaacute convencido de que eacuteste sea un cador satisfactorio Sugiere que la precipitacioacuten pluvial diaria podriacutea tambieacuten tener algo que vausentismo de modo que registra los datos correspondientes y hace una regresioacuten del ausentismte el tiempo de lluvias y obtiene un valor R2 de 059 ldquoiexclEurekardquo grita usted ldquoiexclLo tengo Con uticador que explica 66 y otro que explica 59 todo lo que tengo que hacer es una regresioacutenutilizando ambos y seguramente tendreacute un pronosticador casi perfectordquo Para su desaacutenimo sin la regresioacuten muacuteltiple tiene una R

2 de soacutelo 68 que es solamente un poco mejor que la variablperatura sola iquestCoacutemo puede explicar esta aparente discrepancia

13-28 Juan Armenlegg administrador de Rockyrsquos Diamond y Jewelry Store estaacute interesado en desamodelo para estimar la demanda del consumidor para su costosa mercanciacutea Como la mayoriacutea de

tes compran diamantes y joyas a creacutedito Juan estaacute seguro de que dos factores que deben influirmanda de los clientes son la tasa real de inflacioacuten anual y la tasa real de intereses sobre preacutestamprincipales bancos del paiacutes Explique algunos problemas que Juan podriacutea encontrar si fuera a dun modelo de regresioacuten basado en estas dos variables de prediccioacuten

13-29 Un nuevo programa de juegos Check That Model pide a los concursantes que especifiquen el nuacutenimo de paraacutemetros que necesitan para determinar si un modelo de regresioacuten muacuteltiple es signifimo un todo para ϭ 001 Usted ganoacute la apuesta con 4 paraacutemetros Use la siguiente informacioacutenterminar si la regresioacuten es significativa

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3056

R 2

ϭ 07452

SCE ϭ 1254

n ϭ 18

Nuacutemero de variables independientes ϭ 3

13-30 La Scottish Turist Agency estaacute interesada en el nuacutemero de turistas que entran al paiacutes cada semanrante la temporada alta Se recolectaron los siguientes datos

Turistas (Y ) ϭ nuacutemero de turistas que entran a Escocia en una semana (en miles)

Cambio (X 1)ϭ nuacutemero de libras escocesas compradas por $1 doacutelar

Precio (X 2) ϭ nuacutemero de libras escocesas cobradas por viaje redondo en camioacuten de Londres a Edimburgo

Promoc (X 3) ϭ cantidad gastada en promocioacuten del paiacutes (en miles de libras escocesas)Temp (X 4) ϭ temperatura media durante la semana en Edimburgo (en grados Celsius)

Turistas (Y ) Cambio (X 1) Precio (X 2) Promoc (X 3) Temp (X 4)

69 061 40 87 154

71 059 40 88 156

68 063 40 85 154

79 061 35 86 153

76 060 35 94 158

82 065 35 99 162

80 058 35 98 164

84 059 35 102 166

97 061 30 114 174

98 062 30 116 172

72 057 40 84 176

67 055 40 86 164

a) Utilice el paquete de software que tenga para determinar la ecuacioacuten de regresioacuten que mejote a los datos de la agencia de turismo

b) iquestEs la tasa de cambio una variable explicativa significativa Establezca y pruebe las hipoacutetesidas a un nivel de significancia de 010

c) Un incremento de 1000 libras en las promociones iquestaumenta el nuacutemero de turistas en maacutesEstablezca y pruebe las hipoacutetesis adecuadas para un nivel de significancia de 005

d) Calcule un intervalo de confianza del 95 para el coeficiente de la pendiente de Temp

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-4 Como SCT ϭ SCR ϩ SCE SCE ϭ SCT Ϫ SCR ϭ 10236 Ϫ 8724 ϭ 1512Como gl SCT ϭ gl SCR ϩ gl SCE gl SCR ϭ gl SCT Ϫ gl SCE ϭ 24 Ϫ 17 ϭ 7

Entonces F ϭ ϭ ϭ 1401

F CRiacuteT ϭ F (7 17 005) ϭ 261Como F OBS gt F CRIacuteT se concluye que la regresioacuten es significativa como un todo Edith debe conticando la salida de computadora de la regresioacuten para usarla en la junta

EA 13-5 De la salida de computadora se obti enen los siguientes resultadosa) VENTAS ϭ 17234 ϩ 25950PROMOC Ϫ13238COMPET Ϫ 3041GRATISb) H0 BGRATIS ϭ 0 H1 BGRATIS Ͻ 0 ϭ 005

Eacutesta es una prueba de una cola y el valor prob en los resultados es para la alternativa de dos c BGRATIS 0 De manera que para esta prueba el valor prob es 02212 ϭ 0111 Ͼ ϭ 00que no se puede rechazar H0 las ventas no disminuyen significativamente cuando aumenta ro de pasajeros que vuelan gratis

c) H0 BPROMOC ϭ 28 H1 BPROMOC 28 ϭ 010

87247ᎏᎏ

151217SCRk ᎏᎏ

SCE(n Ϫ k Ϫ 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3156

El valor observado t de los resultados de regresioacuten es

ϭ ϭ Ϫ0420

Con 11 grados de libertad y ϭ 010 en ambas colas combinadas los valores criacuteticos t parba son Ϯ1796 asiacute el valor observado estaacute dentro de la regioacuten de aceptacioacuten No se rechacambio en VENTAS para un incremento de una unidad ($1000) en PROMOC no es significate diferente de 28 ($28000)

d) Con 11 grados de libertad el valor t para un intervalo del 90 de confianza es 1796 por lo

tervalo esbCOMP Ϯ 1796sbCOMP

ϭ Ϫ13238 Ϯ 1796(3686)

ϭ Ϫ13238 Ϯ 6620 ϭ (Ϫ19858 Ϫ 6618)

La liacutenea aeacuterea puede tener una seguridad del 90 de que el ingreso por los boletos en una ofminuye entre $6600 y $19900 aproximadamente con cada liacutenea aeacuterea adicional que comp

135 Teacutecnicas de modelado

Dada una variable que deseamos explicar y un conjunto de variables explicativas potencialehaya varias ecuaciones de regresioacuten diferentes que podamos estudiar dependiendo de queacute explicativas incluyamos y de coacutemo lo hagamos Cada una de esas ecuaciones de regresioacutence como modelo Las teacutecnicas de modelado son las distintas formas en que podemos incluriables explicativas y verificar queacute tan apropiados son los modelos de regresioacuten Existen municas de modelado diferentes pero soacutelo veremos dos de las maacutes utilizadas

Datos cualitativos y variables ficticias

En todos los ejemplos de regresioacuten que hemos visto hasta ahora los datos manejados hanmeacutericos o cuantitativos Pero ocasionalmente nos enfrentaremos con una variable categoacuterilitativa En el problema del inicio el capiacutetulo el director de personal desea ver si el salarioun vendedor depende de su sexo En la tabla 13-5 repetimos los datos de dicho problema

Por el momento ignore la antiguumledad y utilice la teacutecnica desarrollada en el capiacutetulo 9 bar la diferencia entre las medias de dos poblaciones para ver si los hombres ganan maacutes qu

jeres Pruebe con ϭ 001 Si tomamos a los hombres como la poblacioacuten 1 y a las mujerespoblacioacuten 2 probaremos las siguientes hipoacutetesis

H0 1 ϭ 2 larr Hipoacutetesis nula no existe discriminacioacuten por sexo en los salarios base

H1 1 Ͼ 2 larr Hipoacutetesis alternativa se discrimina a las mujeres en su salario base

ϭ 001 larr Nivel de significancia

Revisioacuten del enfoqueanterior del problema

Buacutesqueda dediferentes modelos

25950 Ϫ 28ᎏᎏ

4877

(bPROMOC Ϫ 28)ᎏᎏ

sbPROMOC

Datos para el problemade discriminacioacuten porsexo

Tabla 13-5 Vendedores VendedorasAntiguumledad Salario base Antiguumledad Salario base(en meses) (en miles) (en meses) (en miles)

6 75 5 62

10 86 13 87

12 91 15 94

18 103 21 98

30 130

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3256

A continuacioacuten bosquejamos el anaacutelisis Si tiene problemas para seguirlo deberaacute repasamente la seccioacuten 93

n1 ϭ 5 n2 ϭ 4

x ෆ1 ϭ 97 x ෆ2 ϭ 8525

s2

1 ϭ 4415 s2

2 ϭ 2609

s2

p ϭ

ϭ

ϭ 3641

x ෆ1Ϫ x

ෆ2ϭ s pΊ ϩ

ϭ 128

t ϭ

ϭ

ϭ 092

Con siete grados de libertad el valor t criacutetico para una prueba de cola superior con ϭ 001 eComo el valor t observado de 092 es menor que 2998 no podemos rechazar H0

Entonces el anaacutelisis concluye que no parece haber discriminacioacuten por sexo en los salarPero recuerde que hasta ahora se han ignorado los datos de antiguumledad laboral para el anaacuteli

Antes de seguir vea el diagrama de dispersioacuten de los datos En la figura 13-9 los punto

corresponden a los hombres y los blancos a las mujeres El diagrama de dispersioacuten muestraridad que el salario base aumenta con los antildeos de antiguumledad pero si con la mirada sigue lo qla recta de regresioacuten notaraacute que los puntos negros tienden a estar arriba de ella y los blancos

La figura 13-10 da la salida de una regresioacuten del salario base sobre los meses de antiguumlelos resultados se ve que la antiguumledad es una variable explicativa altamente significativa

Ademaacutes r 2

ϭ 926 que indica que la variable meses de antiguumledad explica cerca del 9variacioacuten en el salario base La figura 13-11 contiene parte de la salida que no se vio antesbla de residuos Para cada punto el residuo es simplemente Y Ϫ Y ˆ que se reconoce como el

Una ldquomiradardquo a los

datos

El enfoque anterior nodetecta discriminacioacuten

(97 ndash 8525) ndash 0ᎏᎏ

128

( x ෆ1 ndash x ෆ2) ndash (1 Ϫ 2)H0

ᎏᎏᎏ

ˆ x ෆ1Ϫ

x ෆ2

1ᎏ

n2

1ᎏ

n1

4(4415) ϩ 3(2609)ᎏᎏᎏ5 ϩ 4 ndash 2

(n1 ndash 1)s21 ϩ (n2 ndash 1)s22ᎏᎏᎏ

n1 ϩ n2 ndash 2

FIGURA 13-9

Diagrama de dis-persioacuten de salariosbase contra mesesde antiguumledad

4 8 12 16 20 24 28

4

8

12

Meses de antiguumledad

S a l a r i o ( m i l e s d e d oacute l a r e s )

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3356

el ajuste de la recta de regresioacuten en ese punto En la figura 13-11 AJUST1 son los valores y RESI1 son los residuos

Tal vez la parte maacutes importante del anaacutelisis del resultado de una regresioacuten sea estusiduos Si la regresioacuten incluye todos los factores explicativos relevantes estos residuo

ser aleatorios Dicho de otro modo si los residuos muestran cualquier patroacuten no aleat

to indica que hay algo sistemaacutetico que afecta el proceso y que no hemos tomado en cu

manera que buscamos patrones en los residuos o para decirlo de forma maacutes pintoresca ldquopmos a los residuos hasta hacerlos hablarrdquo

Si observamos los residuos presentados en la figura 13-11 vemos que los primeros cincoson positivos De modo que para los vendedores tenemos Y ndash Y ˆ Ͼ 0 o Y Ͼ Y ˆ es decir laregresioacuten cae abajo de estos cinco puntos Tres de los cuatro uacuteltimos residuos son negaticonsiguiente para las vendedoras tenemos Y Ϫ Y ˆ Ͻ 0 o Y Ͻ Y ˆ asiacute que la recta de regresicuentra arriba de tres de los cuatro puntos Esto confirma lo que vimos al observar el diagdispersioacuten de la figura 13-9 Este patroacuten no aleatorio en los residuos sugiere que el sexo siacute etor determinante del salario base

iquestCoacutemo podemos incorporar el sexo de los vendedores dentro del modelo de regresioacutencemos utilizando un dispositivo llamado variable ficticia (o variable indicadora) Para lpuntos que representan a los vendedores esta variable tiene valor de 0 y para los cuatro purepresentan a las vendedoras valdraacute 1 Los datos de entrada para nuestra regresioacuten con variticias se dan en la tabla 13-6

Para los datos de la tabla 13-6 se ajusta una regresioacuten de la forma

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

Uso de variablesficticias

Deteccioacuten depatrones en losresiduos

ldquoPresionar a losresiduosrdquo

Anaacutel i s i s de r e gr e s i oacuten

La ec uac i oacuten de r e gr es i oacuten esSALARI O ϭ 5 81 ϩ 0 233 MESES

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t pCons t a nt e 5 8093 0 4038 14 39 0 000MESES 0 23320 0 02492 9 36 0 000

s ϭ 0 5494 R- s q ϭ 92 6

Anaacute l i s i s de va r i a nz aFUENTE GL SC MC F Re gr e s i oacuten 1 26 443 24 443 87 61 0Er r or 7 2 113 0 302Tot a l 8 28 556

FIGURA 13-10

Regresioacuten conMinitab del salariobase sobre losmeses deantiguumledad

RENGLOacuteN SALARI O AJ UST1 RESI 1

1 7 5 7 2085 0 2914992 8 6 8 1413 0 458684

3 9 1 8 6077 0 4922764 10 3 10 0069 0 2930545 13 0 12 8054 0 1946076 6 2 6 9753 - 0 7752977 8 7 8 8409 - 0 1409288 9 4 9 3073 0 0926649 9 8 10 7066 - 0 906558

FIGURA 13-11

Tabla de residuosde Minitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1356

n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad El valor apropiado de t para nuestracioacuten del intervalo es de 2447 En consecuencia podemos calcular los liacutemites de nutervalo de confianza como sigue

Y ˆ ϩ t (se) ϭ 27905000 ϩ (2447)(286000)

Y ˆ ϩ t(se) ϭ 27905000 ϩ 699800

Y ˆ ϩ t(se) ϭ 28604800 larr Liacutemite superior

Y ˆ Ϫ t (se) ϭ 27905000 Ϫ (2447)(286000)

Y ˆ ϩ t(se) ϭ 27905000 ndash 699800

Y ˆ ϩ t(se) ϭ 27205200 larr Liacutemite inferior

Con un nivel de confianza del 95 el departamento de auditoriacuteas puede sentirse sque los descubrimientos reales estaraacuten en este intervalo que va de $27205200 a $28Si el IRS desea usar un nivel de confianza menor como 90 puede reducir el intevalores para la estimacioacuten de descubrimientos de impuestos no pagados Igual que cgresioacuten simple podemos utilizar la distribucioacuten normal estaacutendar (tabla 1 del apeacutendaproximar la distribucioacuten t siempre que los grados de libertad (n menos el nuacutemero cientes de regresioacuten estimados) sea un nuacutemero mayor que 30

Al antildeadir la tercera variable independiente (recompensas a informantes) iquestmejoroacuteregresioacuten Como se mide la dispersioacuten de los datos alrededor del plano de regresioacutenmenores de se deberiacutean indicar mejores regresiones Para la regresioacuten de dos variablecimos con anterioridad en este mismo capiacutetulo se resultoacute ser 1076 Como al agregarra variable se se redujo a 0286 vemos que siacute mejoroacute el ajuste de la regresioacuten en este Sin embargo en general no es cierto que al agregar variables siempre se reduzc

3 El coeficiente de determinacioacuten muacuteltiple Al estudiar el anaacutelisis de correlacioacuten simpmos la fuerza de la relacioacuten entre dos variables utilizando el coeficiente de determinla muestra r 2 Este coeficiente de determinacioacuten es la fraccioacuten de la variacioacuten total riable dependiente Y que se explica con la ecuacioacuten de estimacioacuten

Similarmente en la correlacioacuten muacuteltiple mediremos la fuerza de la relacioacuten entre trbles utilizando el coeficiente de determinacioacuten muacuteltiple R

2 o su raiacutez cuadrada R (el cte de correlacioacuten muacuteltiple) Este coeficiente de determinacioacuten muacuteltiple es tambieacuten la

que representa la porcioacuten de la variacioacuten total de Y que ldquoexplicardquo el plano de regr

Note que la salida del programa da el valor 983 para R2 Esto nos dice que las tr

bles independientes explican el 983 de la variacioacuten total de impuestos no pagadobiertos Para la regresioacuten de dos variables hecha antes R2 es soacutelo 0729 asiacute que las trabajo en auditoriacutea de campo y las horas en computadora explican el 729 de la vaagregar las recompensas a los informantes explica el 254 restante de la variacioacuten

Todaviacutea no hemos explicado los nuacutemeros en las columnas etiquetadas con Desvciente t y p de la figura 13-2 Estos nuacutemeros se utilizaraacuten para hacer inferencias acercano de regresioacuten de la poblacioacuten tema que se trataraacute en la seccioacuten 13-4

Uso del coeficientede determinacioacutenmuacuteltiple

Valor de variablesadicionales

Interpretacioacuten delintervalo deconfianza

Ya nadie calcula regresiones a mano hayotras cosas maacutes interesantes en queacute ocu-par nuestro tiempo Se explicoacute la teacutecnicacalculando las soluciones a mano para

que no tenga que pensar en su computadora como en unaldquocaja negrardquo que hace muchas cosas uacutetiles que no puedeexplicar Sugerencia el valor real de usar la computadorapara calcular regresiones muacuteltiples es que puede manejarmuchas variables independientes y obtener una mejor ecua-

cioacuten de estimacioacuten que puede medir si agregar otrble independiente realmente mejora los resultados yposible observar con rapidez el comportamiento de

indica la proporcioacuten de la variacioacuten total de la variapendiente que se explica con las variables indepenLa computadora hace todo el trabajo tedioso mdashsin semdash y le deja tiempo para el trabajo maacutes importcomprender los resultados y usarlos para tomar mdecisiones

SUGERENCIASY

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1456

La ec uac i oacuten de r egr es i oacuten esY = - 12 75 + 17 1 X1 + 0 54 1 X2 - 0 17 4 X3

Pr onos t i c ador Coe f De s vEs t Coc i e nt e - t pCons t a n t e - 1275 2699 - 0 47 0 719X1 17 059 6 908 2 47 0 245X2 0 5406 0 3144 1 72 0 335X3 - 0 1743 0 1005 - 1 73 0 333

s = 396 1 R- s q = 87 2

b) iquestQueacute porcentaje de la variacioacuten total del nuacutemero de solicitudes urgentes de devolucioacuten de impuestosexplica esta ecuacioacuten

c) Para este antildeo el iacutendice econoacutemico es 169 la poblacioacuten residente en un radio de una milla desde la

oficina es 10212 habitantes y el ingreso promedio en Ithaca es $26925 iquestCuaacutentas solicitudes urgen-tes de devolucioacuten de impuestos debe Pam esperar procesar entre el 1 de marzo y el 15 de abril

Conceptos baacutesicos 13-14 Dado el siguiente conjunto de datos utilice el paquete de software que tenga disponible para encontrar la

ecuacioacuten de regresioacuten de mejor ajuste y responda a lo siguientea) iquestCuaacutel es la ecuacioacuten de regresioacutenb) iquestCuaacutel es el error estaacutendar de la estimacioacutenc) iquestCuaacutel es el valor de R

2 para esta regresioacutend) iquestCuaacutel es el valor pronosticado para Y cuando X 1 ϭ 58 X 2 ϭ 42 y X 3 ϭ 51

Y X 1 X 2 X 3

647 35 53 85809 74 16 26246 25 63 45439 37 94 88777 55 14 36206 83 92 25669 67 25 27343 12 22 13

Ejercicios 133

Ejercicios de autoevaluacioacuten

EA 13-3 Pam Schneider posee y opera un despacho de contadores en Ithaca Nueva York Ella piensa que seriacutea uacutetilpredecir el nuacutemero de solicitudes urgentes de devolucioacuten de impuestos que le pediraacuten durante el ajetrea-do periodo del 1 de marzo al 15 de abril para poder planear mejor sus necesidades de personal duranteesta eacutepoca Tiene la hipoacutetesis de que varios factores pueden ser uacutetiles para su pronoacutestico Los datos de es-tos factores y el nuacutemero de solicitudes urgentes de devolucioacuten de impuestos de antildeos pasados son

Y X 2 Nuacutemero de

Poblacioacuten solicitudesresidente X 3 de devolucioacuten

X 1 en un radio Ingreso urgentesIacutendice de una milla promedio (1 de marzo

econoacutemico desde la oficina en Ithaca a 15 de abril)

99 10188 21465 2306106 8566 22228 1266100 10557 27665 1422129 10219 25200 1721179 9662 26300 2544

a) Use el siguiente resultado de Minitab para determinar la ecuacioacuten de regresioacuten maacutes adecuada para es-

tos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1556

13-15 Dado el siguiente conjunto de datos utilice el paquete de software que tenga a su disposicioacuten patrar la ecuacioacuten de regresioacuten de mejor ajuste y responda a lo siguientea) iquestCuaacutel es la ecuacioacuten de regresioacutenb) iquestCuaacutel es el error estaacutendar de la estimacioacutenc) iquestCuaacutel es el valor de R2 para esta regresioacutend) Deacute un intervalo de confianza para la estimacioacuten del 95 para el valor Y cuando los valores X

y X 4 son 524 416 358 y 3 respectivamente

X 1 X 2 X 3 X 4 Y

214 629 219 Ϫ2 228

517 407 429 5 937418 818 698 2 649

118 410 909 Ϫ4 192

716 226 129 8 558

919 615 309 1 231

Aplicaciones

1316 Las estaciones de policiacutea en Estados Unidos estaacuten interesadas en predecir el nuacutemero de arrestodos que deberaacuten procesar cada mes para programar mejor a los empleados de oficina En los daricos el nuacutemero promedio de arrestos (Y ) cada mes tiene influencia del nuacutemero de oficiales en

policiaca ( X 1) la poblacioacuten de la ciudad en miles ( X 2) y el porcentaje de personas desempleadasdad en miles ( X 3) Los datos de estos factores en 15 ciudades se presentan en la tablaa) Utilice el paquete de software que tenga disponible para determinar la ecuacioacuten de regresioacuten

jor se ajuste a estos datosb) iquestQueacute porcentaje de la variacioacuten total en el nuacutemero de arrestos (Y ) explica esta ecuacioacutenc) El departamento de policiacutea de ChapelBoro desea pronosticar el nuacutemero de arrestos mensua

pelBoro tiene una poblacioacuten de 75000 habitantes 82 elementos en su fuerza policiaca y utaje de desempleo del 105 iquestCuaacutentos arrestos pronostica para cada mes

Nuacutemero promedio Nuacutemero de oficiales Tamantildeo de la ciudad (X 2) Porcende arrestos mensuales (Y ) en la fuerza (X 1) en miles de habitantes desemp

3906 68 816 4

5043 94 751 3

6284 125 973 5

7456 175 1235 8

5852 113 1184 11

4503 82 654 9

3278 46 616 12

2605 32 543 18

4775 89 974 4

3898 67 824 6

3124 47 564 8

3675 59 713 7

3744 61 674 9

4946 87 963 11

4875 92 864 4

13-17 Estamos intentando predecir la demanda anual (DEMAND) de cierto producto utilizando las svariables independientes

PRECIO ϭ precio del producto (en doacutelares)

INGRESO ϭ ingreso del consumidor (en doacutelares)

SUB ϭ precio de un bien sustituto (en doacutelares)

( Nota Un bien sustituto es aquel que puede suplir a otro bien Por ejemplo la margarina es untituto de la mantequilla)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1656

Se recolectaron datos correspondientes al periodo 1982-1996

Antildeo Demanda Precio ($) Ingreso ($) Sub ($)

1982 40 9 400 101983 45 8 500 141984 50 9 600 121985 55 8 700 131986 60 7 800 111987 70 6 900 151988 65 6 1000 161989 65 8 1100 17

1990 75 5 1200 221991 75 5 1300 191992 80 5 1400 201993 100 3 1500 231994 90 4 1600 181995 95 3 1700 241996 85 4 1800 21

a) Utilice el paquete de software que tenga disponible para encontrar la ecuacioacuten de regresioacuten ajuste para estos datos

b) iquestSon los signos (ϩ o Ϫ) de los coeficientes de regresioacuten de las variables independientes los qperan Deacute una explicacioacuten breve ( Nota Eacutesta no es una pregunta estadiacutestica soacutelo necesita pesignifican los coeficientes de regresioacuten)

c) Establezca e interprete el coeficiente de determinacioacuten muacuteltiple del problemad) Establezca e interprete el error estaacutendar de la estimacioacuten para el problemae) Seguacuten la ecuacioacuten de regresioacuten obtenida iquestqueacute valor de DEMAND predeciriacutea si el precio de

ductos fue $6 el ingreso del consumidor $1200 y el precio del bien sustituto $17 13-18 Bill Buxton profesor de estadiacutestica de una prominente escuela de administracioacuten tiene un prof

tereacutes en los factores que afectan el desempentildeo de los estudiantes en los exaacutemenes El examen psemestre anterior tuvo una distribucioacuten de calificaciones amplia pero Bill tiene la certeza de qfactores explican esa distribucioacuten permite a sus estudiantes que estudien en tantos libros comoca el coeficiente de inteligencia de los estudiantes variacutea tienen distintas edades y difieren losque dedican a estudiar Con el propoacutesito de desarrollar una foacutermula de prediccioacuten para las califde los exaacutemenes Bill pidioacute a cada estudiante que respondiera al final del examen preguntas refe

tiempo de estudio y nuacutemero de libros utilizados Los registros que teniacutea Bill ya incluiacutean el coefiinteligencia y la edad de modo que reunioacute los datos del grupo y corrioacute la regresioacuten muacuteltiple deLa salida de la corrida de Bill fue la siguiente

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t Con s t a nt e minus49 948 41 55 minus1 20 0HORAS 1 06931 0 98163 1 09 0CI 1 36460 0 37627 3 63 0LI BROS 2 03982 1 50799 1 35 0EDAD minus1 79890 0 67332 minus2 67 0

s = 11 657 R- s q = 76 7

a) iquestCuaacutel es la ecuacioacuten de regresioacuten de mejor ajuste para estos datos

b) iquestQueacute porcentaje de la variacioacuten en las calificaciones se explica con esta ecuacioacutenc) iquestQueacute calificacioacuten esperariacutea usted para un estudiante de 21 antildeos de edad con un coeficiente gencia (CI) de 113 que estudioacute durante cinco horas y utilizoacute tres libros diferentes

13-19 La compantildeiacutea de tiendas de abarrotes Twenty-Two estaacute planeando expandir su cadena Como ayudleccionar los lugares donde abriraacute las nuevas tiendas recolectoacute datos de las ventas semanales de casus 23 tiendas Para explicar la variabilidad de las ventas semanales tambieacuten reunioacute informacioacutencribe cuatro variables que se cree estaacuten relacionadas con las ventas Las variables se definen como

VENTAS ϭ ventas semanales promedio en cada tienda en miles de doacutelares

AUTOS ϭ volumen promedio de traacutensito de automoacuteviles por semana en miles de autos

ENTRADA ϭ facilidad de entradasalida medida en una escala de 1 a 100

INGANUAL ϭ ingreso anual promedio por familia en el aacuterea en miles de doacutelares

DISTANCIA ϭ distancia en millas desde la tienda al supermercado maacutes cercano

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1756

Los datos se analizaron con Minitab y la salida es la siguiente

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t Cons t a nt e 175 37 92 62 1 89 0 0AUTOS - 0 028 0 315 minus0 09 0 9ENTRADA 3 775 1 272 2 97 0 0I NGANUAL 1 990 4 510 0 44 0 6DI STANCI A 212 41 28 090 7 56 0 0

s = 85 587 R- s q = 95 8

a) iquestCuaacutel es la ecuacioacuten de regresioacuten de mejor ajuste dada por Minitab

b) iquestCuaacutel es el error estaacutendar de la estimacioacuten para esta ecuacioacutenc) iquestQueacute fraccioacuten de la variacioacuten en las ventas se explica con esta regresioacutend) iquestQueacute ventas predeciriacutea para una tienda localizada en un vecindario que tuvo un ingreso anu

milia de $20000 estaba a 2 millas del supermercado maacutes cercano se encontraba en una calvolumen promedio semanal de traacutensito de 100000 autos y con una facilidad de entrada de

13-20 Rick Blackburn estaacute pensando en vender su casa Con el fin de decidir el precio que pediraacute poreunido datos de 12 ventas recientes Registroacute el precio de venta (en miles de doacutelares) el nuacutemercuadrados de construccioacuten (en cientos de pies cuadrados) el nuacutemero de pisos el nuacutemero de bantiguumledad de la casa (en antildeos)

Precio de venta Pies cuad Pisos Bantildeos Antiguumledad

4965 89 1 10 2

6795 95 1 10 68115 126 2 15 11

8160 129 2 15 8

9150 190 2 10 22

9525 176 1 10 17

10035 200 2 15 12

10425 206 2 15 11

11265 205 1 20 9

14970 251 2 20 8

16065 227 2 20 18

23250 408 3 40 12

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de

de mejor ajuste para los datosb) iquestCuaacutel es el valor de R2 para esta ecuacioacutenc) Si la casa de Rick tiene 1800 pies cuadrados (ϭ 180 cientos de pies cuadrados) un piso

y seis antildeos de antiguumledad iquestqueacute precio de venta puede esperar Rick 13-21 La Allegheny Steel Corporation ha estado buscando los factores que influyen en la cantidad de

millones de toneladas) que puede vender cada antildeo La administracioacuten sospecha que los siguientfactores principales la tasa anual de inflacioacuten del paiacutes el precio promedio por tonelada del acetado que acota los precios (en doacutelares) de Allegheny y el nuacutemero de automoacuteviles (en millonesfabricantes de autos de Estados Unidos planean producir ese antildeo Se recolectaron los datos de losiete antildeos

Y X 2 X 3

Millones X 1 Cota de Nuacutemero

de tons Tasa de importa- deAntildeo vendidas inflacioacuten ciones automoacuteviles

1993 42 31 310 62

1992 31 39 500 51

1991 40 75 220 57

1990 47 107 450 71

1989 43 155 435 65

1988 37 130 260 61

1987 35 110 305 59

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1856

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de regresioacutende mejor ajuste para los datos

b) iquestQueacute porcentaje de la variacioacuten total de la cantidad de acero vendido (en millones de toneladas) porAllegheny cada antildeo explica esta ecuacioacuten

c) iquestCuaacutentas toneladas de acero deberaacute esperar Allegheny vender en un antildeo en el que la tasa de inflacioacutenes 71 los fabricantes de automoacuteviles norteamericanos planean producir 60 millones de autos y la co-ta promedio del acero importado por tonelada es $350

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-3 De la salida del paquete de software se obtienen los siguientes resultadosa) Y ˆ ϭ Ϫ1275 ϩ 17059 X 1 ϩ 05406 X 2 Ϫ 01743 X 3b) R

2ϭ 872 el modelo explica el 872 de la variacioacuten total en Y

c) Y ˆ ϭ Ϫ1275 ϩ 17059(169) ϩ 05406(10212) Ϫ 01743(26925) ϭ 2436 reembolsos de impuestos

134 Inferencias sobre paraacutemetrosde poblacioacuten

En el capiacutetulo 12 se vio que la recta de regresioacuten de la muestra Y ˆ ϭ a ϩ bX (ecuacioacuten 12-3) esti-maba la recta de regresioacuten de la poblacioacuten Y ϭ A ϩ BX (ecuacioacuten 12-13) La razoacuten por la cual soacute-lo podiacuteamos estimar la recta de regresioacuten de poblacioacuten y no determinarla con exactitud era que los

puntos no caen exactamente en la recta de regresioacuten de la poblacioacuten Debido a las variaciones alea-torias los puntos satisfaciacutean Y ϭ A ϩ BX ϩ e (ecuacioacuten 12-13a) maacutes que a Y ϭ A ϩ BX

En la regresioacuten muacuteltiple se tiene justo la misma situacioacuten Nuestro plano de regresioacuten estimado

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k [13-5]

es una estimacioacuten de un plano de regresioacuten de poblacioacuten verdadero pero desconocido de la forma

Plano de regresioacutende la poblacioacuten

De nuevo los puntos individuales normalmente no caen con exactitud en el plano de regresioacuten depoblacioacuten Consideremos el problema del Servicio Interno de Contribuciones para ver por queacute Notodos los pagos a informantes tendraacuten la misma efectividad Algunas horas en computadora podriacuteanutilizarse para recolectar y organizar datos otras para analizar esos datos en busca de errores y frau-des El eacutexito de la computadora en descubrir impuestos no pagados puede depender de cuaacutento tiempose dedique a cada una de estas actividades Por eacutestas y otras razones algunos de los puntos se en-contraraacuten arriba del plano de regresioacuten y algunos estaraacuten abajo de eacuteste En lugar de satisfacer laecuacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

los puntos individuales satisfaraacuten la ecuacioacuten

Las variaciones alea-torias desplazan lospuntos del plano deregresioacuten

Ecuacioacuten de regresioacuten de la poblacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

Plano de regresioacuten de la poblacioacuten maacutes la variacioacuten aleatoria

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e [13-7a]

La cantidad e que aparece en la ecuacioacuten 13-7a es una variacioacuten aleatoria que en promedio es iguala cero La desviacioacuten estaacutendar de las variaciones individuales e y el error estaacutendar de la estima-cioacuten se que estudiamos en la seccioacuten anterior es una estimacioacuten de e

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1956

Como nuestro plano de regresioacuten de la muestra Y ˆ ϭ a ϩ b1X1 ϩ b2 X 2 ϩ ϩ bk X k (ecuaci13-7) estima el plano de regresioacuten de poblacioacuten desconocido Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk

(ecuacioacuten 13-7) deberemos ser capaces de usarlo para hacer inferencias sobre el plano de regreside la poblacioacuten En esta seccioacuten haremos inferencias acerca de las pendientes ( B1 B2 Bk ) deecuacioacuten de regresioacuten ldquoverdaderardquo (la que se aplica a la poblacioacuten completa) basadas en las pendietes (b1 b2 bk ) de la ecuacioacuten de regresioacuten estimada a partir de la muestra de datos

Inferencias acerca de una pendiente individual B i El plano de regresioacuten se deriva de una muestra y no de la poblacioacuten completa Como resultado

podemos esperar que la ecuacioacuten de regresioacuten verdadera Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k que se aplica a la poblacioacuten completa) sea exactamente igual que la ecuacioacuten estimada a partir observaciones de la muestra Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k Sin embargo podemos utilizarvalor de bi una de las pendientes que calculamos a partir de la muestra para probar hipoacutetesis acca del valor de Bi una de las pendientes del plano de regresioacuten para la poblacioacuten completa

El procedimiento para probar una hipoacutetesis respecto a Bi es parecido al procedimiento analizaen los capiacutetulos 8 y 9 sobre pruebas de hipoacutetesis Para entender este proceso regresemos al probma que relaciona los impuestos no pagados descubiertos con las horas de trabajo en auditoriacuteas campo horas en computadora y recompensas a informantes En la paacutegina 729 sentildealamos que b10597 El primer paso consiste en encontrar un valor para B1 y compararlo con b1 ϭ 0597

Suponga que durante un periodo largo la pendiente de la relacioacuten entre Y y X 1 fue 0400 Paprobar si todaviacutea es vaacutelida podriacuteamos definir las hipoacutetesis como

H0 B1 ϭ 0400 larr Hipoacutetesis nula

H1 B1 0400 larr Hipoacutetesis alternativa

De hecho realizamos la prueba para saber si los datos actuales indican que B1 ha cambiado su vahistoacuterico de 0400

Para encontrar el estadiacutestico de prueba para B1 es necesario hallar primero el error estaacutendar d

coeficiente de regresioacuten El coeficiente de regresioacuten con el que estamos trabajando es b1 de moque el error estaacutendar de este coeficiente se representa con sb1

Resulta demasiado difiacutecil calcular sb1 a mano pero por fortuna Minitab calcula los errores estaacutedar de todos los coeficientes de regresioacuten Por comodidad repetimos la figura 13-2 Los errores taacutendar de los coeficientes se dan en la columna DesvEst de la salida de Minitab

En el cuadro de salida vemos que sb1

es 00811 (Similarmente si deseamos probar una hipoacutesis acerca de B2 vemos que el error estaacutendar apropiado que debemos utilizar es sb2 ϭ 00841) Uvez que encontramos sb1 en la salida de Minitab podemos usar la ecuacioacuten 13-8 para estandarizarpendiente de nuestra ecuacioacuten de regresioacuten ajustada

Estandarizacioacutendel coeficiente deregresioacuten

Error estaacutendar delcoeficientede regresioacuten

Prueba de unahipoacutetesis acerca de B i

Diferencia entre la

ecuacioacuten de regre-sioacuten verdadera y unaestimada a partir delas observacionesde la muestra

Coeficiente de regresioacuten estandarizado

t ϭ [13-8bi ndash Bi0ᎏ

sbi

donde

bull biϭ pendiente de la regresioacuten ajustada

bull Bi0 ϭ pendiente real hipoteacutetica para la poblacioacutenbull sbi ϭ error estaacutendar del coeficiente de regresioacuten

iquestPor queacute utilizamos t para denotar el estadiacutestico estandarizado Recuerde que en la regresioacuten siple utilizamos a y b en la ecuacioacuten 12-7 para calcular se y que se estimaba e la desviacioacuten estaacutedar de las variaciones de los datos (ecuacioacuten 12-13a) Entonces utilizamos se en la ecuacioacuten 12-para encontrar sb el error estaacutendar del coeficiente de regresioacuten que corresponde a la pendiente E

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2056

pezamos con n puntos y los usamos para estimar los dos coeficientes a y b Luego basamtras pruebas en la distribucioacuten t con n Ϫ 2 grados de libertad

De manera similar en la regresioacuten muacuteltiple tambieacuten empezamos con n puntos pero lospara estimar k ϩ 1 coeficientes la ordenada a y k pendientes b1 b2 bk Despueacutes estcientes se usan en la ecuacioacuten 13-6 para calcular se que de nuevo es una estimacioacuten de eviacioacuten estaacutendar de las variaciones de los datos (ecuacioacuten 13-7a) Luego se utiliza se (en ucioacuten que estaacute maacutes allaacute del alcance de este libro) para encontrar s

bi Debido a lo anterior

nuestras pruebas de hipoacutetesis en la distribucioacuten t con n Ϫ k Ϫ 1 (ϭ n Ϫ ( k ϩ l)) grados de En nuestro ejemplo el valor estandarizado del coeficiente de regresioacuten es

t ϭ

ϭ

ϭ 2432 larr Coeficiente de regresioacuten estandarizado

Suponga que estamos interesados en probar nuestras hipoacutetesis al nivel de significancia

Como tenemos 10 observaciones en la muestra y tres variables independientes sabemos n Ϫ k Ϫ 1 o 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad Buscamos en la tabla 2 del apeacutendice en lana de 10 y el rengloacuten de 6 grados de libertad Ahiacute vemos que el valor apropiado de t es 19mo nos preocupa si b1 (la pendiente del plano de regresioacuten de la muestra) es significativamferente de B1 (la pendiente hipoteacutetica del plano de regresioacuten de la poblacioacuten) eacutesta es una pdos colas y los valores criacuteticos son Ϯ1943 El coeficiente de regresioacuten estandarizado es 2se encuentra fuera de la regioacuten de aceptacioacuten de nuestra prueba de hipoacutetesis Por consiguichazamos la hipoacutetesis nula de que B1 todaviacutea es igual a 0400 En otras palabras existe unacia suficientemente grande entre b1 y 0400 para concluir que B1 ha cambiado respecto a histoacuterico Por esto sentimos que cada 100 horas adicionales de trabajo en auditoriacuteas de camaumentan la cantidad de descubrimientos de impuestos no pagados en $400000 como lo hel pasado

Ademaacutes de la prueba de hipoacutetesis podemos construir un intervalo de confianza para cude los valores de Bi Del mismo modo que bi es una estimacioacuten puntual de Bi estos intervalofianza son estimaciones de intervalo de Bi Para ilustrar el proceso de construccioacuten de interconfianza encontremos un intervalo de confianza del 95 para B3 en el ejemplo del IRS Lrelevantes son

b3 ϭ 0405 de la figura 13-2sb3 ϭ 00422

t ϭ 2447 larr Nivel de significancia del 5 y 6 grados de libertad

Intervalo deconfianza para B i

Realizacioacuten de la

prueba de hipoacutetesis

0597 ndash 0400ᎏᎏ

0081

b1 ndash B10ᎏ

sb1

Anaacute l i s i s de r e gr e s i oacutenLa ec uaci oacuten de r egr es i oacuten esDESCUBRE = - 45 0 + 0 597 AUDI TORIacute A + 1 18 COMPUTADORA + 0 405 RECOMPENSA

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 45 796 4 878 - 9 39 0 000AUDI TORIacute A 0 50697 0 08112 7 36 0 000COMPUTADORA 1 17684 0 08407 14 00 0 000RECOMPENSAS 0 40511 0 04223 9 59 0 000

s = 0 2861 R- s q = 98 3

FIGURA 13-2

Salida de Minitab(figura repetida)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2156

Con esta informacioacuten podemos calcular el intervalo de confianza de la siguiente manera

b3 ϩ t (sb3) ϭ 0405 ϩ 2447(00422)

ϭ 0508 larr Liacutemite superior

b3 Ϫ t (sb3) ϭ 0405 Ϫ 2447(00422)

ϭ 0302 larr Liacutemite inferior

Vemos que podemos tener una seguridad del 95 de que cada $1000 adicionales pagados a los formantes aumenta el descubrimiento de impuestos no pagados en una cantidad entre $302000$508000

A menudo estaremos interesados en preguntas del tipo iquesten realidad Y depende de X i Por ejeplo podriacuteamos preguntar si descubrir impuestos no pagados en realidad depende de las horas encomputadora Con frecuencia esta pregunta se plantea como iquestes X i una variable explicativa sigficativa de Y Si piensa un poco maacutes se convenceraacute de que si Bi 0 Y depende de las X i (esto esvariacutea cuando X i variacutea) y no depende de X i si Bi ϭ 0

Vemos que nuestra pregunta conduce a establecer hipoacutetesis de la forma

H0 Bi ϭ 0 larr Hipoacutetesis nula X i no es una variable explicativa significativa

H1 Bi 0 larr Hipoacutetesis alternativa X i es una variable explicativa significativa

Podemos probar estas hipoacutetesis utilizando la ecuacioacuten 13-8 del mismo modo que cuando probamnuestras hipoacutetesis acerca de si B1 todaviacutea era igual a 0400 Sin embargo existe una forma maacutes faacutede hacerlo usando la columna de la figura 13-2 de ldquocociente- t rdquo Observemos de nuevo la ecuaci13-8

t ϭ [13-

Como nuestro valor hipoteacutetico de Bi es cero el valor estandarizado del coeficiente de regresioacutedenotado por t o se convierte en

t o ϭ

El valor de t o se conoce como valor t ldquocalculadordquo Eacuteste es el nuacutemero que aparece en la columna equetada como ldquocociente-t rdquo en la figura 13-2 Denotemos por t c el valor t ldquocriacuteticordquo que buscamos

la tabla 2 del apeacutendice Entonces como la prueba para determinar si X i es una variable explicatisignificativa es una prueba de dos colas soacutelo necesitamos verificar si Ϫt c Յ t o Յ t c

Uso de valores t

calculados en lasalida de Minitab

biᎏ

sbi

bi ndash Bi0ᎏ

sbi

iquestEs significativa unavariable explicativa

Prueba para determinar si una variable es o no significativa

Ϫt c Յ t o Յ t c [13-9

donde

bull t c ϭ valor t adecuado (con n Ϫ k Ϫ 1 grados de libertad) para el nivel de significancia deprueba

bull t o ϭ bi sbi ϭ valor t observado (o calculado) obtenido con el paquete de software

Si t o

cae entre Ϫt c

y t c aceptamos H0 y llegamos a la conclusioacuten de que X

ino es una variable exp

cativa significativa En cualquier otro caso rechazamos H0 y concluimos que X i es una variable eplicativa significativa

Probemos al nivel de significancia de 001 si las horas en computadora constituyen una variabexplicativa significativa para los impuestos no pagados descubiertos De la tabla 2 del apeacutendice cn Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad y ϭ 001 vemos que t c ϭ 3707 De la figura 13tenemos que t o = 1400 Como t o Ͼ t c concluimos que el tiempo en computadora es una variab

Prueba de lasignificancia de lavariable horas decomputadora en elproblema del IRS

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2256

explicativa significativa De hecho al observar los valores t calculados para las otras dos vindependientes (tiempo de auditoriacuteas de campo t o ϭ 736 y recompensa a informantes t ovemos que tambieacuten son variables explicativas significativas

Podemos tambieacuten utilizar la columna de ldquoprdquo para probar si X i es una variable explicativacativa De hecho utilizando esa informacioacuten ni siquiera necesitamos usar la tabla 2 del aLos elementos de esta columna son los valores prob para las hipoacutetesis

H0 Biϭ 0

H1 Bi 0

Recuerde del anaacutelisis hecho en el capiacutetulo 9 que estos valores prob constituyen la probabque cada bi esteacute tan lejos de cero como (o maacutes) el valor observado obtenido de la regresioacutenverdadera Como se ilustra en la figura 13-3 solamente necesitamos comparar estos valocon el nivel de significancia de la prueba para determinar si X i es o no una variable expsignificativa para Y

Probar la significancia de una variable explicativa es siempre una prueba de dos colas Lble independiente X i es una variable explicativa significativa si bi es significativamente dife

cero es decir si t o es un nuacutemero grande positivo o negativoPara el ejemplo del IRS repetimos las pruebas con ϭ 001 Para cada una de las tres v

independientes p es menor que 001 de forma que podemos concluir que cada una de ellanificativa

Inferencias acerca de la regresioacuten como un todo

(usando una prueba F )

Suponga que cubre con papel un tablero para dardos y lanza varios dardos sobre eacutel Despueacuteberlo hecho tendraacute algo muy parecido a un diagrama de dispersioacuten Suponga entonces quuna recta de regresioacuten a este conjunto de ldquopuntos observadosrdquo y calcula r

2 Debido a que lofueron lanzados aleatoriamente usted espera obtener un valor bajo de r

2 puesto que en esten realidad no explica a Y Sin embargo si hace esto muchas veces ocasionalmente observalor alto de r

2 por pura casualidadDada cualquier regresioacuten simple (o muacuteltiple) es natural preguntarse si el valor de r2 (

realmente indica que las variables independientes explican a Y o si esto sucede por cas

A menudo esta interrogante se plantea de la siguiente manera iquestla regresioacuten como un todo ficativa En la uacuteltima seccioacuten vimos coacutemo decidir si una X i individual es una variable exp

Significancia de laregresioacuten comoun todo

FIGURA 13-3

Uso de ldquoprdquo paradeterminar si X i esuna variable expli-cativa significativa

Regioacuten de aceptacioacuten Regioacuten de aceptacioacuten

2 del aacuterea

2 del aacuterea

2 del aacuterea

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

ndasht c

ndasht o

t o

t c

0

(a) p es mayor que X

i no es una variable

explicativa significativa

(b) p es menor que X

i es una variable

explicativa significativa

ndasht o

ndasht c

t c

0

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2356

significativa ahora veremos coacutemo decidir si todas las X i tomadas en conjunto explican significavamente la variabilidad observada de Y Nuestras hipoacutetesis son

H0 B1 ϭ B2 ϭ ϭ Bk ϭ 0 larr Hipoacutetesis nula Y no depende de las X i

H1 por lo menos una Bi 0 larr Hipoacutetesis alternativa Y depende de al menos una de las X i

Cuando analizamos r 2 en el capiacutetulo 12 consideramos la variacioacuten total en Y sum(Y Ϫ Y ෆ )2 la p

te de dicha variacioacuten que explica la regresioacuten sum(Y ˆ Ϫ Y ෆ )2 y la parte no explicada de la variacioacutensum(Y Ϫ Y ˆ )2 La figura 13-4 es un duplicado de la figura 12-15 Sirve como repaso de la relacioacuten etre la desviacioacuten total la desviacioacuten explicada y la desviacioacuten no explicada para un solo dato en uregresioacuten simple Aunque no podamos dibujar una figura similar para una regresioacuten muacuteltiple coceptualmente estamos haciendo lo mismo

Al analizar la variacioacuten en Y fijamos nuestra atencioacuten en tres teacuterminos diferentes cada uno de cuales es una suma de cuadrados Los denotamos con

Suma de cuadradosy sus grados delibertad

Anaacutelisis de lavariacioacuten de losvalores Y

FIGURA 13-4

Desviacioacuten totaldesviacioacutenexplicada ydesviacioacuten noexplicada paraun valor observadode Y

Y

X

Un valor observado de lavariable dependiente (Y )

R e c t a d

e r e g r e s

i oacute n

Desviacioacuten no explicada de esta Y respectoa su media Y

(Y ndash Y )^

Desviacioacuten explicada deesta Y respecto a su media Y

(Y ndash Y )^Y

Valor estimado de esta Y

a partir de la recta de regresioacuten (Y )^

Desviacioacuten total de esta Y

respecto a su media Y

(Y ndash Y )

Tres sumas de cuadrados

SCT ϭ suma de cuadrados total (es decir la parte explicada) ϭ sum(Y Ϫ Y ෆ )2

SCR ϭ suma de cuadrados de la regresioacuten (es decir la parte explicada) ϭ sum(Y ˆ Ϫ Y ෆ )2 [13-10

SCE ϭ suma de cuadrados del error (es decir la parte no explicada) ϭ sum(Y Ϫ Y ˆ )2

Estaacuten relacionadas por la ecuacioacuten

que dice que la variacioacuten total en Y puede dividirse en dos partes la parte explicada y la no explicaCada una de estas sumas de cuadrados tiene un nuacutemero asociado de grados de libertad SCT t

ne n Ϫ 1 grados de libertad (n observaciones menos un grado de libertad debido a que la media la muestra estaacute fija) SCR tiene k grados de libertad porque existen k variables independientes qse utilizaron para explicar Y Finalmente SCE tiene n Ϫ k Ϫ 1 grados de libertad porque utilizamnuestras n observaciones para estimar k ϩ 1 constantes a b1 b2 bk Si la hipoacutetesis nula es ci

ta el cociente

Descomposicioacuten de la variacioacuten total de Y

SCT ϭ SCR ϩ SCE [13-1

Cociente F

F ϭ [13-12SCR k ᎏᎏ

SCE(n ndash k ndash 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2456

tiene una distribucioacuten F con k grados de libertad en el numerador y n Ϫ k Ϫ 1 grados de libel denominador Si la hipoacutetesis nula es falsa entonces el cociente tiende a ser maacutes grande qula hipoacutetesis nula es verdadera De modo que si el cociente F es demasiado grande (seguacuten lo na el nivel de significancia de la prueba y el valor apropiado de la tabla 6 del apeacutendice) rechH0 y concluimos que la regresioacuten como un todo es significativa

La figura 13-5 presenta la salida de Minitab para el problema del IRS Esta parte del rincluye los cocientes F calculados para la regresioacuten en ocasiones llamado anaacutelisis de v

(ANOVA) para la regresioacuten Probablemente se pregunte si esto tiene algo que ver con el anaacutelisrianza que estudiamos en el capiacutetulo 11 La respuesta es siacute Aunque no lo hicimos es posibletrar que el anaacutelisis de varianza visto en el capiacutetulo 11 tambieacuten contempla la variacioacuten total las observaciones alrededor de la gran media y la divide en dos partes una explicada por lascias entre los distintos grupos (que corresponde a lo que llamamos varianza entre columnas)

no explicada por dichas diferencias (que corresponde a la varianza dentro de columnas) Estcisamente anaacutelogo a lo que acabamos de hacer en la ecuacioacuten 13-11Para el problema del IRS vemos que SCR ϭ 29109 (con k ϭ 3 grados de libertad) SCE

(con n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad) y que

F ϭ ϭ ϭ 11833

Los elementos en la columna ldquoMCrdquo son justo las sumas de cuadrados divididas entre sus glibertad Para 3 grados de libertad en el numerador y 6 en el denominador la tabla 6 del apeacutence que 978 es el liacutemite superior de la regioacuten de aceptacioacuten para un nivel de significancia El valor calculado de F 11833 estaacute muy por arriba de 978 de manera que se ve que la r

como un todo es altamente significativa Se puede llegar a la misma conclusioacuten si se observresultado del programa dice que ldquo prdquo es 0000 Debido a que este valor prob es menor que elsignificancia ϭ 001 se concluye que la regresioacuten completa es significativa De esta mapuede usar la p de ANOVA como prueba sin tener que utilizar la tabla 6 del apeacutendice para bvalor criacutetico de F Esto es anaacutelogo a la manera en que se usaron los valores de p en la figura ra probar la significancia de las variables explicativas individuales

Multicolinealidad en la regresioacuten muacuteltiple

En el anaacutelisis de regresioacuten muacuteltiple los coeficientes de regresioacuten a menudo se vuelven

confiables conforme aumenta el grado de correlacioacuten entre las variables independie

existe un alto nivel de correlacioacuten entre algunas de las variables independientes nos enfrenun problema que los estadiacutesticos llaman multicolinealidad

La multicolinealidad puede presentarse si deseamos estimar la recuperacioacuten de las ventaempresa y utilizamos tanto el nuacutemero de vendedores empleados como sus salarios totales Cvalores asociados con estas dos variables independientes tienen una correlacioacuten alta neceusar soacutelo un conjunto de ellos para realizar nuestra estimacioacuten De hecho al agregar una segriable que estaacute correlacionada con la primera se distorsionan los valores de los coeficientgresioacuten Sin embargo a menudo podemos predecir bien Y incluso cuando haya multicoline

Consideremos un ejemplo donde existe multicolinealidad para ver coacutemo afecta a la regresrante los 12 meses pasados el gerente del restaurante Pizza Shack ha estado poniendo unaanuncios en el perioacutedico local Los anuncios se programan y pagan el mes anterior a que ap

Un ejemplo demulticolinealidad

Definicioacuten y efecto dela multicolinealidad

9703ᎏ

0082

29109 3ᎏ

0491 6Prueba de lasignificancia de laregresioacuten en elproblema del Serviciode Contribuciones

Anaacutelisis devarianza parala regresioacuten

Prueba F de laregresioacuten como

un todo

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 29 1088 9 7029 118 52 0Er r or 6 0 4912 0 0819Tot al 9 29 6000

FIGURA 13-5Salida de Minitabanaacutelisis devarianza

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2556

Cada anuncio contiene un cupoacuten que permite llevarse dos pizzas pagando solamente la de mcio El gerente recolectoacute los datos de la tabla 13-4 y le gustariacutea utilizarlos para predecir las vpizzas

En las figuras 13-6 y 13-7 se dieron los resultados de Minitab para las regresiones respelas ventas totales sobre el nuacutemero de anuncios y sobre el costo

Para la regresioacuten sobre el nuacutemero de anuncios tenemos que el valor t observado es 395grados de libertad y un nivel de significancia de ϭ 001 se encontroacute que el valor t criacuteticdo de la tabla 2 del apeacutendice) es 3169 Como t o Ͼ t c (o de manera equivalente como p es m001) concluimos que el nuacutemero de anuncios es una variable explicativa altamente signifilas ventas totales Note tambieacuten que r 2 ϭ 610 de modo que el nuacutemero de anuncios explximadamente el 61 de la variacioacuten en las ventas de pizzas

Para la regresioacuten sobre el costo de los anuncios el valor t observado es 454 de modo qude los anuncios es una variable explicativa de las ventas totales todaviacutea maacutes significativa que ro de anuncios (para los que el valor t observado fue soacutelo 395) En esta regresioacuten r 2 ϭ 673

el costo de los anuncios explica aproximadamente el 67 de la variacioacuten de las ventas de pizComo ambas variables explicativas son altamente significativas por siacute mismas intentam

zar ambas en una regresioacuten muacuteltiple El resultado se presenta en la figura 13-8La regresioacuten muacuteltiple es altamente significativa como un todo ya que la p de ANOVA e

Uso de ambas varia-bles explicativas enuna regresioacuten muacuteltiple

Dos regresionessimples

Datos de ventas y anun-cios para el restaurantePizza Shack

Tabla 13-4 X 1 X 2 Y

Nuacutemero Costo de anuncios Venta tode anuncios publicados de pizz

Mes publicados (cientos de doacutelares) (miles de d

Mayo 12 139 436

Junio 11 120 380

Julio 9 93 301

Agosto 7 97 353

Septiembre 12 123 464

Octubre 8 114 342

Noviembre 6 93 302

Diciembre 13 143 407

Enero 8 102 385

Febrero 6 84 226

Marzo 8 112 376

Abril 10 111 352

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esVENTAS = 16 9 + 2 08 ANUNCI OS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 16 937 4 982 3 40 0 007ANUNCI OS 2 0832 0 5271 3 95 0 003

s = 4 206 R- s q = 61 0

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 1 276 31 276 31 15 62 Er r or 10 176 88 17 69Tot a l 11 453 19

Figura 13-6

Regresioacuten de lasventas sobre elnuacutemero deanuncios conMinitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2656

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2756

gar el nuacutemero de anuncios como segunda variable explicativa ademaacutes del costo de los anuncios eplica nada maacutes alrededor del 1 adicional de la variacioacuten de las ventas totales

En este punto es justo preguntarse iquestqueacute variable realmente explica la variacioacuten de las ventotales en la regresioacuten muacuteltiple La respuesta es que ambas la explican pero no podemos separ

sus contribuciones individuales debido a que estaacuten altamente correlacionadas entre siacute E

consecuencia sus coeficientes en la regresioacuten muacuteltiple tienen errores estaacutendar altos valore

calculados relativamente bajos y valores prob Ͼ | t | relativamente altos

iquestDe queacute manera nos afecta esta multicolinealidad Todaviacutea podemos hacer predicciones relativmente precisas cuando se encuentra presente note que para la regresioacuten muacuteltiple (la salida se dala figura 13-8) el error estaacutendar de la estimacioacuten que determina el ancho de los intervalos de co

fianza para las predicciones es 3989 mientras que para la regresioacuten simple con el costo de los anucios como variable explicativa (salida en la figura 13-7) tenemos se ϭ 3849 Lo que no podemhacer es predecir con mucha precisioacuten coacutemo cambiaraacuten las ventas si aumentamos en uno el nuacutemede anuncios La regresioacuten muacuteltiple dice que b1 ϭ 0625 (esto es cada anuncio aumenta las ventotales de pizzas alrededor de $625) pero el error estaacutendar de este coeficiente es 112 (es decir apximadamente $1120)

Las contribucionesindividuales nopueden separarse

Ejercicios 134

Ejercicios de autoevaluacioacuten

EA 13-4 Edith Pratt es una ocupada ejecutiva de una compantildeiacutea de transporte de carga a nivel nacional y va tara una junta porque no encuentra la salida de la regresioacuten muacuteltiple elaborada por un asistente Si la regsioacuten total es significativa al nivel 005 ella desea usar las salida de computadora como evidencia para fudamentar algunas ideas que expondraacute en la reunioacuten Sin embargo su ayudante estaacute enfermo De hectoda la informacioacuten que tiene de la regresioacuten muacuteltiple es un trozo de papel con los siguientes datos

Regresioacuten paraEdith Pratt

SCR 8724 con gl

SCE con 17 gl

SCT 10236 con 24 gl

Como el papel ni siquiera tiene todos los nuacutemeros Edith ha concluido que no es uacutetil Usted sin embardebe saber maacutes que ella iquestPuede Edith entrar en la junta o debe seguir buscando la salida de computador

EA 13-5 Una pequentildea liacutenea aeacuterea de Nueva Inglaterra realizoacute una encuesta sobre sus 15 terminales y obtuvo losguientes datos para el mes de febrero donde

VENTAS ϭ ingreso total seguacuten el nuacutemero de boletos vendidos (en miles de doacutelares)

PROMOCϭ cantidad gastada en promociones de la liacutenea aeacuterea en el aacuterea (en miles de doacutelares)

COMPET ϭ nuacutemero de liacuteneas aeacutereas que compiten en esa terminal

GRATIS ϭ nuacutemero de pasajeros que vuelan gratis (por diferentes razones)

Sugerencia el concepto de hacer infe-rencias respecto a una regresioacuten muacutelti-ple es justo lo mismo que se hizo en elcapiacutetulo 12 cuando hicimos inferencias

respecto a una recta de regresioacuten excepto que ahora se em-

plean dos o maacutes variables independientes Advertencia lamulticolinealidad es un problema que debe manejarse enla regresioacuten muacuteltiple y es necesario desarrollar una com-prensioacuten con sentido comuacuten Recuerde que todaviacutea puedehacer predicciones precisas cuando estaacute presente Pero re-cuerde tambieacuten que no puede decir con mucha precisioacuten

cuaacutento cambiaraacute la variable dependiente si ldquomanipulardquo lavariables independientes Entonces el objetivo debe seminimizar la multicolinealidad Sugerencia la mejor regresioacuten muacuteltiple es la que explica la relacioacuten entre los datos asentildealar la responsabilidad de la mayor proporcioacuten de la va

riacioacuten en la variable dependiente con el menor nuacutemero dvariables independientes Advertencia no es una buenidea incluir demasiadas variables independientes soacutelo porque cuenta con una computadora y un paquete de softwarpara estadiacutestica

SUGERENCIAS

Y

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2856

Ventas (doacutelares) Promoc (doacutelares) Compet Gratis

793 25 10 3

2001 55 8 6

1632 60 12 9

2001 79 7 16

1460 52 8 15

1777 76 12 9

309 20 12 8

2919 90 5 10

1600 40 8 43394 96 5 16

1596 55 11 7

863 30 12 6

2375 60 6 10

1072 50 10 4

1550 35 10 4

a) Utilice la siguiente salida de Minitab para determinar la ecuacioacuten de regresioacuten que mejor se ara la liacutenea aeacuterea

La ec uaci oacuten de r egr es i oacuten esVENTAS ϭ 172 ϩ 25 9 PROMOVϪ 13 2 COMPET Ϫ 3 04 GRATI S

Pr onos t i cador Coef Des vEs t Coci ent e - t Cons t ant e 172 34 51 38 3 35 0PROMOV 25 950 4 877 5 32 0COMPET - 13 238 3 686 - 3 59 0GRATI S - 3 041 2 342 - 1 30 0

b) iquestLos pasajeros que vuelan gratis ocasionan una disminucioacuten significativa en las ventas Fpruebe las hipoacutetesis apropiadas Use ϭ 005

c) iquestUn incremento de $1000 en las promociones cambia las ventas en $28000 o el cambio ecativamente diferente de $28000 Formule y pruebe las hipoacutetesis adecuadas Use ϭ 010

d) Calcule un intervalo de confianza del 90 para el coeficiente de la pendiente de la COMPET

Aplicaciones

13-22 Mark Lowtown publica el perioacutedico Mosquito Junction Enquirer y tiene problemas para predectidad de papel perioacutedico que necesita imprimir diariamente Eligioacute aleatoriamente 27 diacuteas del arior y registroacute la siguiente informacioacuten

PESO ϭ peso en libras de papel perioacutedico para la edicioacuten de ese diacutea

CLASIFICADOS ϭ nuacutemero de anuncios clasificados

PUBLICIDAD ϭ nuacutemero de anuncios publicitarios

PLANA COMPLETA ϭ nuacutemero de anuncios a una plana

Utilizando Minitab para hacer una regresioacuten de PESO sobre las otras tres variables Mark obtuguiente salida

Pr onos t i cador Coef Des vEs t Coci ent e- t Cons t ant e 1072 95 872 43 1 23 0CLASI FI CADOS 0 251 0 126 1 99 0PUBLI CI DAD 1 250 0 884 1 41 0PLANA COMPLETA 250 66 67 92 3 69 0

a) Mark siempre ha pensado que cada anuncio publicitario utiliza al menos 3 libras de papel iquestsioacuten le da una razoacuten significativa para dudar esto al nivel del 5

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2956

b) De manera similar Mark siempre ha creiacutedo que cada anuncio clasificado utiliza aproximmedia libra de papel iquestTiene ahora Mark una razoacuten significativa para dudar esto al nivel del

c) Mark vende espacios de anuncios de plana completa a los comerciantes locales a $30 la paacutegberaacute pensar en ajustar sus tarifas si el papel perioacutedico le cuesta $009 por libra Suponga costos son despreciables Establezca expliacutecitamente las hipoacutetesis y una conclusioacuten (Sugere

jando todo lo demaacutes constante cada anuncio adicional de plana completa tiene un costo de bras de papel ϫ $009 por libra ϭ $2256 El punto de equilibrio es 333333 libras iquestPor quel coeficiente de pendiente para PLANA COMPLETA es significativamente mayor que Mark no estaacute obteniendo ganancias y debe cambiar sus tarifas)

13-23 Para los datos del ejercicio 13-18 y un nivel de significancia de 010 iquestcuaacuteles variables son sign

mente explicativas de los resultados de los exaacutemenes (Habiacutea 12 estudiantes en la muestra) 13-24 Para los datos del ejercicio 13-18 y la siguiente salida de Minitab del procedimiento de regresiple hecho por Bill

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 3134 42 783 60Er r or 7 951 25 135 89Tot a l 11 4085 67

a) iquestCuaacutel es el valor observado de F b) A un nivel de significancia de 005 iquestcuaacutel es el valor criacutetico de F que se debe utilizar para d

si la regresioacuten como un todo es significativac) Basaacutendose en las respuestas a los incisos a) y b) iquestes la regresioacuten significativa como un tod

13-25 Remiacutetase al ejercicio 13-19 A un nivel de significancia de 001 iquestes la variable DISTANCIA uble explicativa significativa para VENTAS

13-26 Para los datos del ejercicio 13-19 y la siguiente salida adicional de Minitab al correr la regresioacuten

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 2861495 715374 102 39 0Er r or 18 125761 6896 7Tot a l 22 2987256

Al nivel de significancia de 005 iquestes la regresioacuten significativa como un todo

13-27 Henry Lander es el director de produccioacuten de la Alecos Corporation de Caracas Venezuela Hede que le ayude a determinar una foacutermula para predecir el ausentismo de los empacadores de chipoacutetesis es que la temperatura diaria promedio puede explicar el porcentaje de ausentismo Durios meses reuacutene datos ejecuta el procedimiento de regresioacuten simple y encuentra que la tempeplica 66 de la variacioacuten en el ausentismo Pero Henry no estaacute convencido de que eacuteste sea un cador satisfactorio Sugiere que la precipitacioacuten pluvial diaria podriacutea tambieacuten tener algo que vausentismo de modo que registra los datos correspondientes y hace una regresioacuten del ausentismte el tiempo de lluvias y obtiene un valor R2 de 059 ldquoiexclEurekardquo grita usted ldquoiexclLo tengo Con uticador que explica 66 y otro que explica 59 todo lo que tengo que hacer es una regresioacutenutilizando ambos y seguramente tendreacute un pronosticador casi perfectordquo Para su desaacutenimo sin la regresioacuten muacuteltiple tiene una R

2 de soacutelo 68 que es solamente un poco mejor que la variablperatura sola iquestCoacutemo puede explicar esta aparente discrepancia

13-28 Juan Armenlegg administrador de Rockyrsquos Diamond y Jewelry Store estaacute interesado en desamodelo para estimar la demanda del consumidor para su costosa mercanciacutea Como la mayoriacutea de

tes compran diamantes y joyas a creacutedito Juan estaacute seguro de que dos factores que deben influirmanda de los clientes son la tasa real de inflacioacuten anual y la tasa real de intereses sobre preacutestamprincipales bancos del paiacutes Explique algunos problemas que Juan podriacutea encontrar si fuera a dun modelo de regresioacuten basado en estas dos variables de prediccioacuten

13-29 Un nuevo programa de juegos Check That Model pide a los concursantes que especifiquen el nuacutenimo de paraacutemetros que necesitan para determinar si un modelo de regresioacuten muacuteltiple es signifimo un todo para ϭ 001 Usted ganoacute la apuesta con 4 paraacutemetros Use la siguiente informacioacutenterminar si la regresioacuten es significativa

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3056

R 2

ϭ 07452

SCE ϭ 1254

n ϭ 18

Nuacutemero de variables independientes ϭ 3

13-30 La Scottish Turist Agency estaacute interesada en el nuacutemero de turistas que entran al paiacutes cada semanrante la temporada alta Se recolectaron los siguientes datos

Turistas (Y ) ϭ nuacutemero de turistas que entran a Escocia en una semana (en miles)

Cambio (X 1)ϭ nuacutemero de libras escocesas compradas por $1 doacutelar

Precio (X 2) ϭ nuacutemero de libras escocesas cobradas por viaje redondo en camioacuten de Londres a Edimburgo

Promoc (X 3) ϭ cantidad gastada en promocioacuten del paiacutes (en miles de libras escocesas)Temp (X 4) ϭ temperatura media durante la semana en Edimburgo (en grados Celsius)

Turistas (Y ) Cambio (X 1) Precio (X 2) Promoc (X 3) Temp (X 4)

69 061 40 87 154

71 059 40 88 156

68 063 40 85 154

79 061 35 86 153

76 060 35 94 158

82 065 35 99 162

80 058 35 98 164

84 059 35 102 166

97 061 30 114 174

98 062 30 116 172

72 057 40 84 176

67 055 40 86 164

a) Utilice el paquete de software que tenga para determinar la ecuacioacuten de regresioacuten que mejote a los datos de la agencia de turismo

b) iquestEs la tasa de cambio una variable explicativa significativa Establezca y pruebe las hipoacutetesidas a un nivel de significancia de 010

c) Un incremento de 1000 libras en las promociones iquestaumenta el nuacutemero de turistas en maacutesEstablezca y pruebe las hipoacutetesis adecuadas para un nivel de significancia de 005

d) Calcule un intervalo de confianza del 95 para el coeficiente de la pendiente de Temp

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-4 Como SCT ϭ SCR ϩ SCE SCE ϭ SCT Ϫ SCR ϭ 10236 Ϫ 8724 ϭ 1512Como gl SCT ϭ gl SCR ϩ gl SCE gl SCR ϭ gl SCT Ϫ gl SCE ϭ 24 Ϫ 17 ϭ 7

Entonces F ϭ ϭ ϭ 1401

F CRiacuteT ϭ F (7 17 005) ϭ 261Como F OBS gt F CRIacuteT se concluye que la regresioacuten es significativa como un todo Edith debe conticando la salida de computadora de la regresioacuten para usarla en la junta

EA 13-5 De la salida de computadora se obti enen los siguientes resultadosa) VENTAS ϭ 17234 ϩ 25950PROMOC Ϫ13238COMPET Ϫ 3041GRATISb) H0 BGRATIS ϭ 0 H1 BGRATIS Ͻ 0 ϭ 005

Eacutesta es una prueba de una cola y el valor prob en los resultados es para la alternativa de dos c BGRATIS 0 De manera que para esta prueba el valor prob es 02212 ϭ 0111 Ͼ ϭ 00que no se puede rechazar H0 las ventas no disminuyen significativamente cuando aumenta ro de pasajeros que vuelan gratis

c) H0 BPROMOC ϭ 28 H1 BPROMOC 28 ϭ 010

87247ᎏᎏ

151217SCRk ᎏᎏ

SCE(n Ϫ k Ϫ 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3156

El valor observado t de los resultados de regresioacuten es

ϭ ϭ Ϫ0420

Con 11 grados de libertad y ϭ 010 en ambas colas combinadas los valores criacuteticos t parba son Ϯ1796 asiacute el valor observado estaacute dentro de la regioacuten de aceptacioacuten No se rechacambio en VENTAS para un incremento de una unidad ($1000) en PROMOC no es significate diferente de 28 ($28000)

d) Con 11 grados de libertad el valor t para un intervalo del 90 de confianza es 1796 por lo

tervalo esbCOMP Ϯ 1796sbCOMP

ϭ Ϫ13238 Ϯ 1796(3686)

ϭ Ϫ13238 Ϯ 6620 ϭ (Ϫ19858 Ϫ 6618)

La liacutenea aeacuterea puede tener una seguridad del 90 de que el ingreso por los boletos en una ofminuye entre $6600 y $19900 aproximadamente con cada liacutenea aeacuterea adicional que comp

135 Teacutecnicas de modelado

Dada una variable que deseamos explicar y un conjunto de variables explicativas potencialehaya varias ecuaciones de regresioacuten diferentes que podamos estudiar dependiendo de queacute explicativas incluyamos y de coacutemo lo hagamos Cada una de esas ecuaciones de regresioacutence como modelo Las teacutecnicas de modelado son las distintas formas en que podemos incluriables explicativas y verificar queacute tan apropiados son los modelos de regresioacuten Existen municas de modelado diferentes pero soacutelo veremos dos de las maacutes utilizadas

Datos cualitativos y variables ficticias

En todos los ejemplos de regresioacuten que hemos visto hasta ahora los datos manejados hanmeacutericos o cuantitativos Pero ocasionalmente nos enfrentaremos con una variable categoacuterilitativa En el problema del inicio el capiacutetulo el director de personal desea ver si el salarioun vendedor depende de su sexo En la tabla 13-5 repetimos los datos de dicho problema

Por el momento ignore la antiguumledad y utilice la teacutecnica desarrollada en el capiacutetulo 9 bar la diferencia entre las medias de dos poblaciones para ver si los hombres ganan maacutes qu

jeres Pruebe con ϭ 001 Si tomamos a los hombres como la poblacioacuten 1 y a las mujerespoblacioacuten 2 probaremos las siguientes hipoacutetesis

H0 1 ϭ 2 larr Hipoacutetesis nula no existe discriminacioacuten por sexo en los salarios base

H1 1 Ͼ 2 larr Hipoacutetesis alternativa se discrimina a las mujeres en su salario base

ϭ 001 larr Nivel de significancia

Revisioacuten del enfoqueanterior del problema

Buacutesqueda dediferentes modelos

25950 Ϫ 28ᎏᎏ

4877

(bPROMOC Ϫ 28)ᎏᎏ

sbPROMOC

Datos para el problemade discriminacioacuten porsexo

Tabla 13-5 Vendedores VendedorasAntiguumledad Salario base Antiguumledad Salario base(en meses) (en miles) (en meses) (en miles)

6 75 5 62

10 86 13 87

12 91 15 94

18 103 21 98

30 130

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3256

A continuacioacuten bosquejamos el anaacutelisis Si tiene problemas para seguirlo deberaacute repasamente la seccioacuten 93

n1 ϭ 5 n2 ϭ 4

x ෆ1 ϭ 97 x ෆ2 ϭ 8525

s2

1 ϭ 4415 s2

2 ϭ 2609

s2

p ϭ

ϭ

ϭ 3641

x ෆ1Ϫ x

ෆ2ϭ s pΊ ϩ

ϭ 128

t ϭ

ϭ

ϭ 092

Con siete grados de libertad el valor t criacutetico para una prueba de cola superior con ϭ 001 eComo el valor t observado de 092 es menor que 2998 no podemos rechazar H0

Entonces el anaacutelisis concluye que no parece haber discriminacioacuten por sexo en los salarPero recuerde que hasta ahora se han ignorado los datos de antiguumledad laboral para el anaacuteli

Antes de seguir vea el diagrama de dispersioacuten de los datos En la figura 13-9 los punto

corresponden a los hombres y los blancos a las mujeres El diagrama de dispersioacuten muestraridad que el salario base aumenta con los antildeos de antiguumledad pero si con la mirada sigue lo qla recta de regresioacuten notaraacute que los puntos negros tienden a estar arriba de ella y los blancos

La figura 13-10 da la salida de una regresioacuten del salario base sobre los meses de antiguumlelos resultados se ve que la antiguumledad es una variable explicativa altamente significativa

Ademaacutes r 2

ϭ 926 que indica que la variable meses de antiguumledad explica cerca del 9variacioacuten en el salario base La figura 13-11 contiene parte de la salida que no se vio antesbla de residuos Para cada punto el residuo es simplemente Y Ϫ Y ˆ que se reconoce como el

Una ldquomiradardquo a los

datos

El enfoque anterior nodetecta discriminacioacuten

(97 ndash 8525) ndash 0ᎏᎏ

128

( x ෆ1 ndash x ෆ2) ndash (1 Ϫ 2)H0

ᎏᎏᎏ

ˆ x ෆ1Ϫ

x ෆ2

1ᎏ

n2

1ᎏ

n1

4(4415) ϩ 3(2609)ᎏᎏᎏ5 ϩ 4 ndash 2

(n1 ndash 1)s21 ϩ (n2 ndash 1)s22ᎏᎏᎏ

n1 ϩ n2 ndash 2

FIGURA 13-9

Diagrama de dis-persioacuten de salariosbase contra mesesde antiguumledad

4 8 12 16 20 24 28

4

8

12

Meses de antiguumledad

S a l a r i o ( m i l e s d e d oacute l a r e s )

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3356

el ajuste de la recta de regresioacuten en ese punto En la figura 13-11 AJUST1 son los valores y RESI1 son los residuos

Tal vez la parte maacutes importante del anaacutelisis del resultado de una regresioacuten sea estusiduos Si la regresioacuten incluye todos los factores explicativos relevantes estos residuo

ser aleatorios Dicho de otro modo si los residuos muestran cualquier patroacuten no aleat

to indica que hay algo sistemaacutetico que afecta el proceso y que no hemos tomado en cu

manera que buscamos patrones en los residuos o para decirlo de forma maacutes pintoresca ldquopmos a los residuos hasta hacerlos hablarrdquo

Si observamos los residuos presentados en la figura 13-11 vemos que los primeros cincoson positivos De modo que para los vendedores tenemos Y ndash Y ˆ Ͼ 0 o Y Ͼ Y ˆ es decir laregresioacuten cae abajo de estos cinco puntos Tres de los cuatro uacuteltimos residuos son negaticonsiguiente para las vendedoras tenemos Y Ϫ Y ˆ Ͻ 0 o Y Ͻ Y ˆ asiacute que la recta de regresicuentra arriba de tres de los cuatro puntos Esto confirma lo que vimos al observar el diagdispersioacuten de la figura 13-9 Este patroacuten no aleatorio en los residuos sugiere que el sexo siacute etor determinante del salario base

iquestCoacutemo podemos incorporar el sexo de los vendedores dentro del modelo de regresioacutencemos utilizando un dispositivo llamado variable ficticia (o variable indicadora) Para lpuntos que representan a los vendedores esta variable tiene valor de 0 y para los cuatro purepresentan a las vendedoras valdraacute 1 Los datos de entrada para nuestra regresioacuten con variticias se dan en la tabla 13-6

Para los datos de la tabla 13-6 se ajusta una regresioacuten de la forma

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

Uso de variablesficticias

Deteccioacuten depatrones en losresiduos

ldquoPresionar a losresiduosrdquo

Anaacutel i s i s de r e gr e s i oacuten

La ec uac i oacuten de r e gr es i oacuten esSALARI O ϭ 5 81 ϩ 0 233 MESES

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t pCons t a nt e 5 8093 0 4038 14 39 0 000MESES 0 23320 0 02492 9 36 0 000

s ϭ 0 5494 R- s q ϭ 92 6

Anaacute l i s i s de va r i a nz aFUENTE GL SC MC F Re gr e s i oacuten 1 26 443 24 443 87 61 0Er r or 7 2 113 0 302Tot a l 8 28 556

FIGURA 13-10

Regresioacuten conMinitab del salariobase sobre losmeses deantiguumledad

RENGLOacuteN SALARI O AJ UST1 RESI 1

1 7 5 7 2085 0 2914992 8 6 8 1413 0 458684

3 9 1 8 6077 0 4922764 10 3 10 0069 0 2930545 13 0 12 8054 0 1946076 6 2 6 9753 - 0 7752977 8 7 8 8409 - 0 1409288 9 4 9 3073 0 0926649 9 8 10 7066 - 0 906558

FIGURA 13-11

Tabla de residuosde Minitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1456

La ec uac i oacuten de r egr es i oacuten esY = - 12 75 + 17 1 X1 + 0 54 1 X2 - 0 17 4 X3

Pr onos t i c ador Coe f De s vEs t Coc i e nt e - t pCons t a n t e - 1275 2699 - 0 47 0 719X1 17 059 6 908 2 47 0 245X2 0 5406 0 3144 1 72 0 335X3 - 0 1743 0 1005 - 1 73 0 333

s = 396 1 R- s q = 87 2

b) iquestQueacute porcentaje de la variacioacuten total del nuacutemero de solicitudes urgentes de devolucioacuten de impuestosexplica esta ecuacioacuten

c) Para este antildeo el iacutendice econoacutemico es 169 la poblacioacuten residente en un radio de una milla desde la

oficina es 10212 habitantes y el ingreso promedio en Ithaca es $26925 iquestCuaacutentas solicitudes urgen-tes de devolucioacuten de impuestos debe Pam esperar procesar entre el 1 de marzo y el 15 de abril

Conceptos baacutesicos 13-14 Dado el siguiente conjunto de datos utilice el paquete de software que tenga disponible para encontrar la

ecuacioacuten de regresioacuten de mejor ajuste y responda a lo siguientea) iquestCuaacutel es la ecuacioacuten de regresioacutenb) iquestCuaacutel es el error estaacutendar de la estimacioacutenc) iquestCuaacutel es el valor de R

2 para esta regresioacutend) iquestCuaacutel es el valor pronosticado para Y cuando X 1 ϭ 58 X 2 ϭ 42 y X 3 ϭ 51

Y X 1 X 2 X 3

647 35 53 85809 74 16 26246 25 63 45439 37 94 88777 55 14 36206 83 92 25669 67 25 27343 12 22 13

Ejercicios 133

Ejercicios de autoevaluacioacuten

EA 13-3 Pam Schneider posee y opera un despacho de contadores en Ithaca Nueva York Ella piensa que seriacutea uacutetilpredecir el nuacutemero de solicitudes urgentes de devolucioacuten de impuestos que le pediraacuten durante el ajetrea-do periodo del 1 de marzo al 15 de abril para poder planear mejor sus necesidades de personal duranteesta eacutepoca Tiene la hipoacutetesis de que varios factores pueden ser uacutetiles para su pronoacutestico Los datos de es-tos factores y el nuacutemero de solicitudes urgentes de devolucioacuten de impuestos de antildeos pasados son

Y X 2 Nuacutemero de

Poblacioacuten solicitudesresidente X 3 de devolucioacuten

X 1 en un radio Ingreso urgentesIacutendice de una milla promedio (1 de marzo

econoacutemico desde la oficina en Ithaca a 15 de abril)

99 10188 21465 2306106 8566 22228 1266100 10557 27665 1422129 10219 25200 1721179 9662 26300 2544

a) Use el siguiente resultado de Minitab para determinar la ecuacioacuten de regresioacuten maacutes adecuada para es-

tos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1556

13-15 Dado el siguiente conjunto de datos utilice el paquete de software que tenga a su disposicioacuten patrar la ecuacioacuten de regresioacuten de mejor ajuste y responda a lo siguientea) iquestCuaacutel es la ecuacioacuten de regresioacutenb) iquestCuaacutel es el error estaacutendar de la estimacioacutenc) iquestCuaacutel es el valor de R2 para esta regresioacutend) Deacute un intervalo de confianza para la estimacioacuten del 95 para el valor Y cuando los valores X

y X 4 son 524 416 358 y 3 respectivamente

X 1 X 2 X 3 X 4 Y

214 629 219 Ϫ2 228

517 407 429 5 937418 818 698 2 649

118 410 909 Ϫ4 192

716 226 129 8 558

919 615 309 1 231

Aplicaciones

1316 Las estaciones de policiacutea en Estados Unidos estaacuten interesadas en predecir el nuacutemero de arrestodos que deberaacuten procesar cada mes para programar mejor a los empleados de oficina En los daricos el nuacutemero promedio de arrestos (Y ) cada mes tiene influencia del nuacutemero de oficiales en

policiaca ( X 1) la poblacioacuten de la ciudad en miles ( X 2) y el porcentaje de personas desempleadasdad en miles ( X 3) Los datos de estos factores en 15 ciudades se presentan en la tablaa) Utilice el paquete de software que tenga disponible para determinar la ecuacioacuten de regresioacuten

jor se ajuste a estos datosb) iquestQueacute porcentaje de la variacioacuten total en el nuacutemero de arrestos (Y ) explica esta ecuacioacutenc) El departamento de policiacutea de ChapelBoro desea pronosticar el nuacutemero de arrestos mensua

pelBoro tiene una poblacioacuten de 75000 habitantes 82 elementos en su fuerza policiaca y utaje de desempleo del 105 iquestCuaacutentos arrestos pronostica para cada mes

Nuacutemero promedio Nuacutemero de oficiales Tamantildeo de la ciudad (X 2) Porcende arrestos mensuales (Y ) en la fuerza (X 1) en miles de habitantes desemp

3906 68 816 4

5043 94 751 3

6284 125 973 5

7456 175 1235 8

5852 113 1184 11

4503 82 654 9

3278 46 616 12

2605 32 543 18

4775 89 974 4

3898 67 824 6

3124 47 564 8

3675 59 713 7

3744 61 674 9

4946 87 963 11

4875 92 864 4

13-17 Estamos intentando predecir la demanda anual (DEMAND) de cierto producto utilizando las svariables independientes

PRECIO ϭ precio del producto (en doacutelares)

INGRESO ϭ ingreso del consumidor (en doacutelares)

SUB ϭ precio de un bien sustituto (en doacutelares)

( Nota Un bien sustituto es aquel que puede suplir a otro bien Por ejemplo la margarina es untituto de la mantequilla)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1656

Se recolectaron datos correspondientes al periodo 1982-1996

Antildeo Demanda Precio ($) Ingreso ($) Sub ($)

1982 40 9 400 101983 45 8 500 141984 50 9 600 121985 55 8 700 131986 60 7 800 111987 70 6 900 151988 65 6 1000 161989 65 8 1100 17

1990 75 5 1200 221991 75 5 1300 191992 80 5 1400 201993 100 3 1500 231994 90 4 1600 181995 95 3 1700 241996 85 4 1800 21

a) Utilice el paquete de software que tenga disponible para encontrar la ecuacioacuten de regresioacuten ajuste para estos datos

b) iquestSon los signos (ϩ o Ϫ) de los coeficientes de regresioacuten de las variables independientes los qperan Deacute una explicacioacuten breve ( Nota Eacutesta no es una pregunta estadiacutestica soacutelo necesita pesignifican los coeficientes de regresioacuten)

c) Establezca e interprete el coeficiente de determinacioacuten muacuteltiple del problemad) Establezca e interprete el error estaacutendar de la estimacioacuten para el problemae) Seguacuten la ecuacioacuten de regresioacuten obtenida iquestqueacute valor de DEMAND predeciriacutea si el precio de

ductos fue $6 el ingreso del consumidor $1200 y el precio del bien sustituto $17 13-18 Bill Buxton profesor de estadiacutestica de una prominente escuela de administracioacuten tiene un prof

tereacutes en los factores que afectan el desempentildeo de los estudiantes en los exaacutemenes El examen psemestre anterior tuvo una distribucioacuten de calificaciones amplia pero Bill tiene la certeza de qfactores explican esa distribucioacuten permite a sus estudiantes que estudien en tantos libros comoca el coeficiente de inteligencia de los estudiantes variacutea tienen distintas edades y difieren losque dedican a estudiar Con el propoacutesito de desarrollar una foacutermula de prediccioacuten para las califde los exaacutemenes Bill pidioacute a cada estudiante que respondiera al final del examen preguntas refe

tiempo de estudio y nuacutemero de libros utilizados Los registros que teniacutea Bill ya incluiacutean el coefiinteligencia y la edad de modo que reunioacute los datos del grupo y corrioacute la regresioacuten muacuteltiple deLa salida de la corrida de Bill fue la siguiente

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t Con s t a nt e minus49 948 41 55 minus1 20 0HORAS 1 06931 0 98163 1 09 0CI 1 36460 0 37627 3 63 0LI BROS 2 03982 1 50799 1 35 0EDAD minus1 79890 0 67332 minus2 67 0

s = 11 657 R- s q = 76 7

a) iquestCuaacutel es la ecuacioacuten de regresioacuten de mejor ajuste para estos datos

b) iquestQueacute porcentaje de la variacioacuten en las calificaciones se explica con esta ecuacioacutenc) iquestQueacute calificacioacuten esperariacutea usted para un estudiante de 21 antildeos de edad con un coeficiente gencia (CI) de 113 que estudioacute durante cinco horas y utilizoacute tres libros diferentes

13-19 La compantildeiacutea de tiendas de abarrotes Twenty-Two estaacute planeando expandir su cadena Como ayudleccionar los lugares donde abriraacute las nuevas tiendas recolectoacute datos de las ventas semanales de casus 23 tiendas Para explicar la variabilidad de las ventas semanales tambieacuten reunioacute informacioacutencribe cuatro variables que se cree estaacuten relacionadas con las ventas Las variables se definen como

VENTAS ϭ ventas semanales promedio en cada tienda en miles de doacutelares

AUTOS ϭ volumen promedio de traacutensito de automoacuteviles por semana en miles de autos

ENTRADA ϭ facilidad de entradasalida medida en una escala de 1 a 100

INGANUAL ϭ ingreso anual promedio por familia en el aacuterea en miles de doacutelares

DISTANCIA ϭ distancia en millas desde la tienda al supermercado maacutes cercano

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1756

Los datos se analizaron con Minitab y la salida es la siguiente

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t Cons t a nt e 175 37 92 62 1 89 0 0AUTOS - 0 028 0 315 minus0 09 0 9ENTRADA 3 775 1 272 2 97 0 0I NGANUAL 1 990 4 510 0 44 0 6DI STANCI A 212 41 28 090 7 56 0 0

s = 85 587 R- s q = 95 8

a) iquestCuaacutel es la ecuacioacuten de regresioacuten de mejor ajuste dada por Minitab

b) iquestCuaacutel es el error estaacutendar de la estimacioacuten para esta ecuacioacutenc) iquestQueacute fraccioacuten de la variacioacuten en las ventas se explica con esta regresioacutend) iquestQueacute ventas predeciriacutea para una tienda localizada en un vecindario que tuvo un ingreso anu

milia de $20000 estaba a 2 millas del supermercado maacutes cercano se encontraba en una calvolumen promedio semanal de traacutensito de 100000 autos y con una facilidad de entrada de

13-20 Rick Blackburn estaacute pensando en vender su casa Con el fin de decidir el precio que pediraacute poreunido datos de 12 ventas recientes Registroacute el precio de venta (en miles de doacutelares) el nuacutemercuadrados de construccioacuten (en cientos de pies cuadrados) el nuacutemero de pisos el nuacutemero de bantiguumledad de la casa (en antildeos)

Precio de venta Pies cuad Pisos Bantildeos Antiguumledad

4965 89 1 10 2

6795 95 1 10 68115 126 2 15 11

8160 129 2 15 8

9150 190 2 10 22

9525 176 1 10 17

10035 200 2 15 12

10425 206 2 15 11

11265 205 1 20 9

14970 251 2 20 8

16065 227 2 20 18

23250 408 3 40 12

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de

de mejor ajuste para los datosb) iquestCuaacutel es el valor de R2 para esta ecuacioacutenc) Si la casa de Rick tiene 1800 pies cuadrados (ϭ 180 cientos de pies cuadrados) un piso

y seis antildeos de antiguumledad iquestqueacute precio de venta puede esperar Rick 13-21 La Allegheny Steel Corporation ha estado buscando los factores que influyen en la cantidad de

millones de toneladas) que puede vender cada antildeo La administracioacuten sospecha que los siguientfactores principales la tasa anual de inflacioacuten del paiacutes el precio promedio por tonelada del acetado que acota los precios (en doacutelares) de Allegheny y el nuacutemero de automoacuteviles (en millonesfabricantes de autos de Estados Unidos planean producir ese antildeo Se recolectaron los datos de losiete antildeos

Y X 2 X 3

Millones X 1 Cota de Nuacutemero

de tons Tasa de importa- deAntildeo vendidas inflacioacuten ciones automoacuteviles

1993 42 31 310 62

1992 31 39 500 51

1991 40 75 220 57

1990 47 107 450 71

1989 43 155 435 65

1988 37 130 260 61

1987 35 110 305 59

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1856

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de regresioacutende mejor ajuste para los datos

b) iquestQueacute porcentaje de la variacioacuten total de la cantidad de acero vendido (en millones de toneladas) porAllegheny cada antildeo explica esta ecuacioacuten

c) iquestCuaacutentas toneladas de acero deberaacute esperar Allegheny vender en un antildeo en el que la tasa de inflacioacutenes 71 los fabricantes de automoacuteviles norteamericanos planean producir 60 millones de autos y la co-ta promedio del acero importado por tonelada es $350

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-3 De la salida del paquete de software se obtienen los siguientes resultadosa) Y ˆ ϭ Ϫ1275 ϩ 17059 X 1 ϩ 05406 X 2 Ϫ 01743 X 3b) R

2ϭ 872 el modelo explica el 872 de la variacioacuten total en Y

c) Y ˆ ϭ Ϫ1275 ϩ 17059(169) ϩ 05406(10212) Ϫ 01743(26925) ϭ 2436 reembolsos de impuestos

134 Inferencias sobre paraacutemetrosde poblacioacuten

En el capiacutetulo 12 se vio que la recta de regresioacuten de la muestra Y ˆ ϭ a ϩ bX (ecuacioacuten 12-3) esti-maba la recta de regresioacuten de la poblacioacuten Y ϭ A ϩ BX (ecuacioacuten 12-13) La razoacuten por la cual soacute-lo podiacuteamos estimar la recta de regresioacuten de poblacioacuten y no determinarla con exactitud era que los

puntos no caen exactamente en la recta de regresioacuten de la poblacioacuten Debido a las variaciones alea-torias los puntos satisfaciacutean Y ϭ A ϩ BX ϩ e (ecuacioacuten 12-13a) maacutes que a Y ϭ A ϩ BX

En la regresioacuten muacuteltiple se tiene justo la misma situacioacuten Nuestro plano de regresioacuten estimado

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k [13-5]

es una estimacioacuten de un plano de regresioacuten de poblacioacuten verdadero pero desconocido de la forma

Plano de regresioacutende la poblacioacuten

De nuevo los puntos individuales normalmente no caen con exactitud en el plano de regresioacuten depoblacioacuten Consideremos el problema del Servicio Interno de Contribuciones para ver por queacute Notodos los pagos a informantes tendraacuten la misma efectividad Algunas horas en computadora podriacuteanutilizarse para recolectar y organizar datos otras para analizar esos datos en busca de errores y frau-des El eacutexito de la computadora en descubrir impuestos no pagados puede depender de cuaacutento tiempose dedique a cada una de estas actividades Por eacutestas y otras razones algunos de los puntos se en-contraraacuten arriba del plano de regresioacuten y algunos estaraacuten abajo de eacuteste En lugar de satisfacer laecuacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

los puntos individuales satisfaraacuten la ecuacioacuten

Las variaciones alea-torias desplazan lospuntos del plano deregresioacuten

Ecuacioacuten de regresioacuten de la poblacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

Plano de regresioacuten de la poblacioacuten maacutes la variacioacuten aleatoria

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e [13-7a]

La cantidad e que aparece en la ecuacioacuten 13-7a es una variacioacuten aleatoria que en promedio es iguala cero La desviacioacuten estaacutendar de las variaciones individuales e y el error estaacutendar de la estima-cioacuten se que estudiamos en la seccioacuten anterior es una estimacioacuten de e

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1956

Como nuestro plano de regresioacuten de la muestra Y ˆ ϭ a ϩ b1X1 ϩ b2 X 2 ϩ ϩ bk X k (ecuaci13-7) estima el plano de regresioacuten de poblacioacuten desconocido Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk

(ecuacioacuten 13-7) deberemos ser capaces de usarlo para hacer inferencias sobre el plano de regreside la poblacioacuten En esta seccioacuten haremos inferencias acerca de las pendientes ( B1 B2 Bk ) deecuacioacuten de regresioacuten ldquoverdaderardquo (la que se aplica a la poblacioacuten completa) basadas en las pendietes (b1 b2 bk ) de la ecuacioacuten de regresioacuten estimada a partir de la muestra de datos

Inferencias acerca de una pendiente individual B i El plano de regresioacuten se deriva de una muestra y no de la poblacioacuten completa Como resultado

podemos esperar que la ecuacioacuten de regresioacuten verdadera Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k que se aplica a la poblacioacuten completa) sea exactamente igual que la ecuacioacuten estimada a partir observaciones de la muestra Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k Sin embargo podemos utilizarvalor de bi una de las pendientes que calculamos a partir de la muestra para probar hipoacutetesis acca del valor de Bi una de las pendientes del plano de regresioacuten para la poblacioacuten completa

El procedimiento para probar una hipoacutetesis respecto a Bi es parecido al procedimiento analizaen los capiacutetulos 8 y 9 sobre pruebas de hipoacutetesis Para entender este proceso regresemos al probma que relaciona los impuestos no pagados descubiertos con las horas de trabajo en auditoriacuteas campo horas en computadora y recompensas a informantes En la paacutegina 729 sentildealamos que b10597 El primer paso consiste en encontrar un valor para B1 y compararlo con b1 ϭ 0597

Suponga que durante un periodo largo la pendiente de la relacioacuten entre Y y X 1 fue 0400 Paprobar si todaviacutea es vaacutelida podriacuteamos definir las hipoacutetesis como

H0 B1 ϭ 0400 larr Hipoacutetesis nula

H1 B1 0400 larr Hipoacutetesis alternativa

De hecho realizamos la prueba para saber si los datos actuales indican que B1 ha cambiado su vahistoacuterico de 0400

Para encontrar el estadiacutestico de prueba para B1 es necesario hallar primero el error estaacutendar d

coeficiente de regresioacuten El coeficiente de regresioacuten con el que estamos trabajando es b1 de moque el error estaacutendar de este coeficiente se representa con sb1

Resulta demasiado difiacutecil calcular sb1 a mano pero por fortuna Minitab calcula los errores estaacutedar de todos los coeficientes de regresioacuten Por comodidad repetimos la figura 13-2 Los errores taacutendar de los coeficientes se dan en la columna DesvEst de la salida de Minitab

En el cuadro de salida vemos que sb1

es 00811 (Similarmente si deseamos probar una hipoacutesis acerca de B2 vemos que el error estaacutendar apropiado que debemos utilizar es sb2 ϭ 00841) Uvez que encontramos sb1 en la salida de Minitab podemos usar la ecuacioacuten 13-8 para estandarizarpendiente de nuestra ecuacioacuten de regresioacuten ajustada

Estandarizacioacutendel coeficiente deregresioacuten

Error estaacutendar delcoeficientede regresioacuten

Prueba de unahipoacutetesis acerca de B i

Diferencia entre la

ecuacioacuten de regre-sioacuten verdadera y unaestimada a partir delas observacionesde la muestra

Coeficiente de regresioacuten estandarizado

t ϭ [13-8bi ndash Bi0ᎏ

sbi

donde

bull biϭ pendiente de la regresioacuten ajustada

bull Bi0 ϭ pendiente real hipoteacutetica para la poblacioacutenbull sbi ϭ error estaacutendar del coeficiente de regresioacuten

iquestPor queacute utilizamos t para denotar el estadiacutestico estandarizado Recuerde que en la regresioacuten siple utilizamos a y b en la ecuacioacuten 12-7 para calcular se y que se estimaba e la desviacioacuten estaacutedar de las variaciones de los datos (ecuacioacuten 12-13a) Entonces utilizamos se en la ecuacioacuten 12-para encontrar sb el error estaacutendar del coeficiente de regresioacuten que corresponde a la pendiente E

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2056

pezamos con n puntos y los usamos para estimar los dos coeficientes a y b Luego basamtras pruebas en la distribucioacuten t con n Ϫ 2 grados de libertad

De manera similar en la regresioacuten muacuteltiple tambieacuten empezamos con n puntos pero lospara estimar k ϩ 1 coeficientes la ordenada a y k pendientes b1 b2 bk Despueacutes estcientes se usan en la ecuacioacuten 13-6 para calcular se que de nuevo es una estimacioacuten de eviacioacuten estaacutendar de las variaciones de los datos (ecuacioacuten 13-7a) Luego se utiliza se (en ucioacuten que estaacute maacutes allaacute del alcance de este libro) para encontrar s

bi Debido a lo anterior

nuestras pruebas de hipoacutetesis en la distribucioacuten t con n Ϫ k Ϫ 1 (ϭ n Ϫ ( k ϩ l)) grados de En nuestro ejemplo el valor estandarizado del coeficiente de regresioacuten es

t ϭ

ϭ

ϭ 2432 larr Coeficiente de regresioacuten estandarizado

Suponga que estamos interesados en probar nuestras hipoacutetesis al nivel de significancia

Como tenemos 10 observaciones en la muestra y tres variables independientes sabemos n Ϫ k Ϫ 1 o 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad Buscamos en la tabla 2 del apeacutendice en lana de 10 y el rengloacuten de 6 grados de libertad Ahiacute vemos que el valor apropiado de t es 19mo nos preocupa si b1 (la pendiente del plano de regresioacuten de la muestra) es significativamferente de B1 (la pendiente hipoteacutetica del plano de regresioacuten de la poblacioacuten) eacutesta es una pdos colas y los valores criacuteticos son Ϯ1943 El coeficiente de regresioacuten estandarizado es 2se encuentra fuera de la regioacuten de aceptacioacuten de nuestra prueba de hipoacutetesis Por consiguichazamos la hipoacutetesis nula de que B1 todaviacutea es igual a 0400 En otras palabras existe unacia suficientemente grande entre b1 y 0400 para concluir que B1 ha cambiado respecto a histoacuterico Por esto sentimos que cada 100 horas adicionales de trabajo en auditoriacuteas de camaumentan la cantidad de descubrimientos de impuestos no pagados en $400000 como lo hel pasado

Ademaacutes de la prueba de hipoacutetesis podemos construir un intervalo de confianza para cude los valores de Bi Del mismo modo que bi es una estimacioacuten puntual de Bi estos intervalofianza son estimaciones de intervalo de Bi Para ilustrar el proceso de construccioacuten de interconfianza encontremos un intervalo de confianza del 95 para B3 en el ejemplo del IRS Lrelevantes son

b3 ϭ 0405 de la figura 13-2sb3 ϭ 00422

t ϭ 2447 larr Nivel de significancia del 5 y 6 grados de libertad

Intervalo deconfianza para B i

Realizacioacuten de la

prueba de hipoacutetesis

0597 ndash 0400ᎏᎏ

0081

b1 ndash B10ᎏ

sb1

Anaacute l i s i s de r e gr e s i oacutenLa ec uaci oacuten de r egr es i oacuten esDESCUBRE = - 45 0 + 0 597 AUDI TORIacute A + 1 18 COMPUTADORA + 0 405 RECOMPENSA

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 45 796 4 878 - 9 39 0 000AUDI TORIacute A 0 50697 0 08112 7 36 0 000COMPUTADORA 1 17684 0 08407 14 00 0 000RECOMPENSAS 0 40511 0 04223 9 59 0 000

s = 0 2861 R- s q = 98 3

FIGURA 13-2

Salida de Minitab(figura repetida)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2156

Con esta informacioacuten podemos calcular el intervalo de confianza de la siguiente manera

b3 ϩ t (sb3) ϭ 0405 ϩ 2447(00422)

ϭ 0508 larr Liacutemite superior

b3 Ϫ t (sb3) ϭ 0405 Ϫ 2447(00422)

ϭ 0302 larr Liacutemite inferior

Vemos que podemos tener una seguridad del 95 de que cada $1000 adicionales pagados a los formantes aumenta el descubrimiento de impuestos no pagados en una cantidad entre $302000$508000

A menudo estaremos interesados en preguntas del tipo iquesten realidad Y depende de X i Por ejeplo podriacuteamos preguntar si descubrir impuestos no pagados en realidad depende de las horas encomputadora Con frecuencia esta pregunta se plantea como iquestes X i una variable explicativa sigficativa de Y Si piensa un poco maacutes se convenceraacute de que si Bi 0 Y depende de las X i (esto esvariacutea cuando X i variacutea) y no depende de X i si Bi ϭ 0

Vemos que nuestra pregunta conduce a establecer hipoacutetesis de la forma

H0 Bi ϭ 0 larr Hipoacutetesis nula X i no es una variable explicativa significativa

H1 Bi 0 larr Hipoacutetesis alternativa X i es una variable explicativa significativa

Podemos probar estas hipoacutetesis utilizando la ecuacioacuten 13-8 del mismo modo que cuando probamnuestras hipoacutetesis acerca de si B1 todaviacutea era igual a 0400 Sin embargo existe una forma maacutes faacutede hacerlo usando la columna de la figura 13-2 de ldquocociente- t rdquo Observemos de nuevo la ecuaci13-8

t ϭ [13-

Como nuestro valor hipoteacutetico de Bi es cero el valor estandarizado del coeficiente de regresioacutedenotado por t o se convierte en

t o ϭ

El valor de t o se conoce como valor t ldquocalculadordquo Eacuteste es el nuacutemero que aparece en la columna equetada como ldquocociente-t rdquo en la figura 13-2 Denotemos por t c el valor t ldquocriacuteticordquo que buscamos

la tabla 2 del apeacutendice Entonces como la prueba para determinar si X i es una variable explicatisignificativa es una prueba de dos colas soacutelo necesitamos verificar si Ϫt c Յ t o Յ t c

Uso de valores t

calculados en lasalida de Minitab

biᎏ

sbi

bi ndash Bi0ᎏ

sbi

iquestEs significativa unavariable explicativa

Prueba para determinar si una variable es o no significativa

Ϫt c Յ t o Յ t c [13-9

donde

bull t c ϭ valor t adecuado (con n Ϫ k Ϫ 1 grados de libertad) para el nivel de significancia deprueba

bull t o ϭ bi sbi ϭ valor t observado (o calculado) obtenido con el paquete de software

Si t o

cae entre Ϫt c

y t c aceptamos H0 y llegamos a la conclusioacuten de que X

ino es una variable exp

cativa significativa En cualquier otro caso rechazamos H0 y concluimos que X i es una variable eplicativa significativa

Probemos al nivel de significancia de 001 si las horas en computadora constituyen una variabexplicativa significativa para los impuestos no pagados descubiertos De la tabla 2 del apeacutendice cn Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad y ϭ 001 vemos que t c ϭ 3707 De la figura 13tenemos que t o = 1400 Como t o Ͼ t c concluimos que el tiempo en computadora es una variab

Prueba de lasignificancia de lavariable horas decomputadora en elproblema del IRS

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2256

explicativa significativa De hecho al observar los valores t calculados para las otras dos vindependientes (tiempo de auditoriacuteas de campo t o ϭ 736 y recompensa a informantes t ovemos que tambieacuten son variables explicativas significativas

Podemos tambieacuten utilizar la columna de ldquoprdquo para probar si X i es una variable explicativacativa De hecho utilizando esa informacioacuten ni siquiera necesitamos usar la tabla 2 del aLos elementos de esta columna son los valores prob para las hipoacutetesis

H0 Biϭ 0

H1 Bi 0

Recuerde del anaacutelisis hecho en el capiacutetulo 9 que estos valores prob constituyen la probabque cada bi esteacute tan lejos de cero como (o maacutes) el valor observado obtenido de la regresioacutenverdadera Como se ilustra en la figura 13-3 solamente necesitamos comparar estos valocon el nivel de significancia de la prueba para determinar si X i es o no una variable expsignificativa para Y

Probar la significancia de una variable explicativa es siempre una prueba de dos colas Lble independiente X i es una variable explicativa significativa si bi es significativamente dife

cero es decir si t o es un nuacutemero grande positivo o negativoPara el ejemplo del IRS repetimos las pruebas con ϭ 001 Para cada una de las tres v

independientes p es menor que 001 de forma que podemos concluir que cada una de ellanificativa

Inferencias acerca de la regresioacuten como un todo

(usando una prueba F )

Suponga que cubre con papel un tablero para dardos y lanza varios dardos sobre eacutel Despueacuteberlo hecho tendraacute algo muy parecido a un diagrama de dispersioacuten Suponga entonces quuna recta de regresioacuten a este conjunto de ldquopuntos observadosrdquo y calcula r

2 Debido a que lofueron lanzados aleatoriamente usted espera obtener un valor bajo de r

2 puesto que en esten realidad no explica a Y Sin embargo si hace esto muchas veces ocasionalmente observalor alto de r

2 por pura casualidadDada cualquier regresioacuten simple (o muacuteltiple) es natural preguntarse si el valor de r2 (

realmente indica que las variables independientes explican a Y o si esto sucede por cas

A menudo esta interrogante se plantea de la siguiente manera iquestla regresioacuten como un todo ficativa En la uacuteltima seccioacuten vimos coacutemo decidir si una X i individual es una variable exp

Significancia de laregresioacuten comoun todo

FIGURA 13-3

Uso de ldquoprdquo paradeterminar si X i esuna variable expli-cativa significativa

Regioacuten de aceptacioacuten Regioacuten de aceptacioacuten

2 del aacuterea

2 del aacuterea

2 del aacuterea

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

ndasht c

ndasht o

t o

t c

0

(a) p es mayor que X

i no es una variable

explicativa significativa

(b) p es menor que X

i es una variable

explicativa significativa

ndasht o

ndasht c

t c

0

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2356

significativa ahora veremos coacutemo decidir si todas las X i tomadas en conjunto explican significavamente la variabilidad observada de Y Nuestras hipoacutetesis son

H0 B1 ϭ B2 ϭ ϭ Bk ϭ 0 larr Hipoacutetesis nula Y no depende de las X i

H1 por lo menos una Bi 0 larr Hipoacutetesis alternativa Y depende de al menos una de las X i

Cuando analizamos r 2 en el capiacutetulo 12 consideramos la variacioacuten total en Y sum(Y Ϫ Y ෆ )2 la p

te de dicha variacioacuten que explica la regresioacuten sum(Y ˆ Ϫ Y ෆ )2 y la parte no explicada de la variacioacutensum(Y Ϫ Y ˆ )2 La figura 13-4 es un duplicado de la figura 12-15 Sirve como repaso de la relacioacuten etre la desviacioacuten total la desviacioacuten explicada y la desviacioacuten no explicada para un solo dato en uregresioacuten simple Aunque no podamos dibujar una figura similar para una regresioacuten muacuteltiple coceptualmente estamos haciendo lo mismo

Al analizar la variacioacuten en Y fijamos nuestra atencioacuten en tres teacuterminos diferentes cada uno de cuales es una suma de cuadrados Los denotamos con

Suma de cuadradosy sus grados delibertad

Anaacutelisis de lavariacioacuten de losvalores Y

FIGURA 13-4

Desviacioacuten totaldesviacioacutenexplicada ydesviacioacuten noexplicada paraun valor observadode Y

Y

X

Un valor observado de lavariable dependiente (Y )

R e c t a d

e r e g r e s

i oacute n

Desviacioacuten no explicada de esta Y respectoa su media Y

(Y ndash Y )^

Desviacioacuten explicada deesta Y respecto a su media Y

(Y ndash Y )^Y

Valor estimado de esta Y

a partir de la recta de regresioacuten (Y )^

Desviacioacuten total de esta Y

respecto a su media Y

(Y ndash Y )

Tres sumas de cuadrados

SCT ϭ suma de cuadrados total (es decir la parte explicada) ϭ sum(Y Ϫ Y ෆ )2

SCR ϭ suma de cuadrados de la regresioacuten (es decir la parte explicada) ϭ sum(Y ˆ Ϫ Y ෆ )2 [13-10

SCE ϭ suma de cuadrados del error (es decir la parte no explicada) ϭ sum(Y Ϫ Y ˆ )2

Estaacuten relacionadas por la ecuacioacuten

que dice que la variacioacuten total en Y puede dividirse en dos partes la parte explicada y la no explicaCada una de estas sumas de cuadrados tiene un nuacutemero asociado de grados de libertad SCT t

ne n Ϫ 1 grados de libertad (n observaciones menos un grado de libertad debido a que la media la muestra estaacute fija) SCR tiene k grados de libertad porque existen k variables independientes qse utilizaron para explicar Y Finalmente SCE tiene n Ϫ k Ϫ 1 grados de libertad porque utilizamnuestras n observaciones para estimar k ϩ 1 constantes a b1 b2 bk Si la hipoacutetesis nula es ci

ta el cociente

Descomposicioacuten de la variacioacuten total de Y

SCT ϭ SCR ϩ SCE [13-1

Cociente F

F ϭ [13-12SCR k ᎏᎏ

SCE(n ndash k ndash 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2456

tiene una distribucioacuten F con k grados de libertad en el numerador y n Ϫ k Ϫ 1 grados de libel denominador Si la hipoacutetesis nula es falsa entonces el cociente tiende a ser maacutes grande qula hipoacutetesis nula es verdadera De modo que si el cociente F es demasiado grande (seguacuten lo na el nivel de significancia de la prueba y el valor apropiado de la tabla 6 del apeacutendice) rechH0 y concluimos que la regresioacuten como un todo es significativa

La figura 13-5 presenta la salida de Minitab para el problema del IRS Esta parte del rincluye los cocientes F calculados para la regresioacuten en ocasiones llamado anaacutelisis de v

(ANOVA) para la regresioacuten Probablemente se pregunte si esto tiene algo que ver con el anaacutelisrianza que estudiamos en el capiacutetulo 11 La respuesta es siacute Aunque no lo hicimos es posibletrar que el anaacutelisis de varianza visto en el capiacutetulo 11 tambieacuten contempla la variacioacuten total las observaciones alrededor de la gran media y la divide en dos partes una explicada por lascias entre los distintos grupos (que corresponde a lo que llamamos varianza entre columnas)

no explicada por dichas diferencias (que corresponde a la varianza dentro de columnas) Estcisamente anaacutelogo a lo que acabamos de hacer en la ecuacioacuten 13-11Para el problema del IRS vemos que SCR ϭ 29109 (con k ϭ 3 grados de libertad) SCE

(con n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad) y que

F ϭ ϭ ϭ 11833

Los elementos en la columna ldquoMCrdquo son justo las sumas de cuadrados divididas entre sus glibertad Para 3 grados de libertad en el numerador y 6 en el denominador la tabla 6 del apeacutence que 978 es el liacutemite superior de la regioacuten de aceptacioacuten para un nivel de significancia El valor calculado de F 11833 estaacute muy por arriba de 978 de manera que se ve que la r

como un todo es altamente significativa Se puede llegar a la misma conclusioacuten si se observresultado del programa dice que ldquo prdquo es 0000 Debido a que este valor prob es menor que elsignificancia ϭ 001 se concluye que la regresioacuten completa es significativa De esta mapuede usar la p de ANOVA como prueba sin tener que utilizar la tabla 6 del apeacutendice para bvalor criacutetico de F Esto es anaacutelogo a la manera en que se usaron los valores de p en la figura ra probar la significancia de las variables explicativas individuales

Multicolinealidad en la regresioacuten muacuteltiple

En el anaacutelisis de regresioacuten muacuteltiple los coeficientes de regresioacuten a menudo se vuelven

confiables conforme aumenta el grado de correlacioacuten entre las variables independie

existe un alto nivel de correlacioacuten entre algunas de las variables independientes nos enfrenun problema que los estadiacutesticos llaman multicolinealidad

La multicolinealidad puede presentarse si deseamos estimar la recuperacioacuten de las ventaempresa y utilizamos tanto el nuacutemero de vendedores empleados como sus salarios totales Cvalores asociados con estas dos variables independientes tienen una correlacioacuten alta neceusar soacutelo un conjunto de ellos para realizar nuestra estimacioacuten De hecho al agregar una segriable que estaacute correlacionada con la primera se distorsionan los valores de los coeficientgresioacuten Sin embargo a menudo podemos predecir bien Y incluso cuando haya multicoline

Consideremos un ejemplo donde existe multicolinealidad para ver coacutemo afecta a la regresrante los 12 meses pasados el gerente del restaurante Pizza Shack ha estado poniendo unaanuncios en el perioacutedico local Los anuncios se programan y pagan el mes anterior a que ap

Un ejemplo demulticolinealidad

Definicioacuten y efecto dela multicolinealidad

9703ᎏ

0082

29109 3ᎏ

0491 6Prueba de lasignificancia de laregresioacuten en elproblema del Serviciode Contribuciones

Anaacutelisis devarianza parala regresioacuten

Prueba F de laregresioacuten como

un todo

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 29 1088 9 7029 118 52 0Er r or 6 0 4912 0 0819Tot al 9 29 6000

FIGURA 13-5Salida de Minitabanaacutelisis devarianza

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2556

Cada anuncio contiene un cupoacuten que permite llevarse dos pizzas pagando solamente la de mcio El gerente recolectoacute los datos de la tabla 13-4 y le gustariacutea utilizarlos para predecir las vpizzas

En las figuras 13-6 y 13-7 se dieron los resultados de Minitab para las regresiones respelas ventas totales sobre el nuacutemero de anuncios y sobre el costo

Para la regresioacuten sobre el nuacutemero de anuncios tenemos que el valor t observado es 395grados de libertad y un nivel de significancia de ϭ 001 se encontroacute que el valor t criacuteticdo de la tabla 2 del apeacutendice) es 3169 Como t o Ͼ t c (o de manera equivalente como p es m001) concluimos que el nuacutemero de anuncios es una variable explicativa altamente signifilas ventas totales Note tambieacuten que r 2 ϭ 610 de modo que el nuacutemero de anuncios explximadamente el 61 de la variacioacuten en las ventas de pizzas

Para la regresioacuten sobre el costo de los anuncios el valor t observado es 454 de modo qude los anuncios es una variable explicativa de las ventas totales todaviacutea maacutes significativa que ro de anuncios (para los que el valor t observado fue soacutelo 395) En esta regresioacuten r 2 ϭ 673

el costo de los anuncios explica aproximadamente el 67 de la variacioacuten de las ventas de pizComo ambas variables explicativas son altamente significativas por siacute mismas intentam

zar ambas en una regresioacuten muacuteltiple El resultado se presenta en la figura 13-8La regresioacuten muacuteltiple es altamente significativa como un todo ya que la p de ANOVA e

Uso de ambas varia-bles explicativas enuna regresioacuten muacuteltiple

Dos regresionessimples

Datos de ventas y anun-cios para el restaurantePizza Shack

Tabla 13-4 X 1 X 2 Y

Nuacutemero Costo de anuncios Venta tode anuncios publicados de pizz

Mes publicados (cientos de doacutelares) (miles de d

Mayo 12 139 436

Junio 11 120 380

Julio 9 93 301

Agosto 7 97 353

Septiembre 12 123 464

Octubre 8 114 342

Noviembre 6 93 302

Diciembre 13 143 407

Enero 8 102 385

Febrero 6 84 226

Marzo 8 112 376

Abril 10 111 352

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esVENTAS = 16 9 + 2 08 ANUNCI OS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 16 937 4 982 3 40 0 007ANUNCI OS 2 0832 0 5271 3 95 0 003

s = 4 206 R- s q = 61 0

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 1 276 31 276 31 15 62 Er r or 10 176 88 17 69Tot a l 11 453 19

Figura 13-6

Regresioacuten de lasventas sobre elnuacutemero deanuncios conMinitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2656

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2756

gar el nuacutemero de anuncios como segunda variable explicativa ademaacutes del costo de los anuncios eplica nada maacutes alrededor del 1 adicional de la variacioacuten de las ventas totales

En este punto es justo preguntarse iquestqueacute variable realmente explica la variacioacuten de las ventotales en la regresioacuten muacuteltiple La respuesta es que ambas la explican pero no podemos separ

sus contribuciones individuales debido a que estaacuten altamente correlacionadas entre siacute E

consecuencia sus coeficientes en la regresioacuten muacuteltiple tienen errores estaacutendar altos valore

calculados relativamente bajos y valores prob Ͼ | t | relativamente altos

iquestDe queacute manera nos afecta esta multicolinealidad Todaviacutea podemos hacer predicciones relativmente precisas cuando se encuentra presente note que para la regresioacuten muacuteltiple (la salida se dala figura 13-8) el error estaacutendar de la estimacioacuten que determina el ancho de los intervalos de co

fianza para las predicciones es 3989 mientras que para la regresioacuten simple con el costo de los anucios como variable explicativa (salida en la figura 13-7) tenemos se ϭ 3849 Lo que no podemhacer es predecir con mucha precisioacuten coacutemo cambiaraacuten las ventas si aumentamos en uno el nuacutemede anuncios La regresioacuten muacuteltiple dice que b1 ϭ 0625 (esto es cada anuncio aumenta las ventotales de pizzas alrededor de $625) pero el error estaacutendar de este coeficiente es 112 (es decir apximadamente $1120)

Las contribucionesindividuales nopueden separarse

Ejercicios 134

Ejercicios de autoevaluacioacuten

EA 13-4 Edith Pratt es una ocupada ejecutiva de una compantildeiacutea de transporte de carga a nivel nacional y va tara una junta porque no encuentra la salida de la regresioacuten muacuteltiple elaborada por un asistente Si la regsioacuten total es significativa al nivel 005 ella desea usar las salida de computadora como evidencia para fudamentar algunas ideas que expondraacute en la reunioacuten Sin embargo su ayudante estaacute enfermo De hectoda la informacioacuten que tiene de la regresioacuten muacuteltiple es un trozo de papel con los siguientes datos

Regresioacuten paraEdith Pratt

SCR 8724 con gl

SCE con 17 gl

SCT 10236 con 24 gl

Como el papel ni siquiera tiene todos los nuacutemeros Edith ha concluido que no es uacutetil Usted sin embardebe saber maacutes que ella iquestPuede Edith entrar en la junta o debe seguir buscando la salida de computador

EA 13-5 Una pequentildea liacutenea aeacuterea de Nueva Inglaterra realizoacute una encuesta sobre sus 15 terminales y obtuvo losguientes datos para el mes de febrero donde

VENTAS ϭ ingreso total seguacuten el nuacutemero de boletos vendidos (en miles de doacutelares)

PROMOCϭ cantidad gastada en promociones de la liacutenea aeacuterea en el aacuterea (en miles de doacutelares)

COMPET ϭ nuacutemero de liacuteneas aeacutereas que compiten en esa terminal

GRATIS ϭ nuacutemero de pasajeros que vuelan gratis (por diferentes razones)

Sugerencia el concepto de hacer infe-rencias respecto a una regresioacuten muacutelti-ple es justo lo mismo que se hizo en elcapiacutetulo 12 cuando hicimos inferencias

respecto a una recta de regresioacuten excepto que ahora se em-

plean dos o maacutes variables independientes Advertencia lamulticolinealidad es un problema que debe manejarse enla regresioacuten muacuteltiple y es necesario desarrollar una com-prensioacuten con sentido comuacuten Recuerde que todaviacutea puedehacer predicciones precisas cuando estaacute presente Pero re-cuerde tambieacuten que no puede decir con mucha precisioacuten

cuaacutento cambiaraacute la variable dependiente si ldquomanipulardquo lavariables independientes Entonces el objetivo debe seminimizar la multicolinealidad Sugerencia la mejor regresioacuten muacuteltiple es la que explica la relacioacuten entre los datos asentildealar la responsabilidad de la mayor proporcioacuten de la va

riacioacuten en la variable dependiente con el menor nuacutemero dvariables independientes Advertencia no es una buenidea incluir demasiadas variables independientes soacutelo porque cuenta con una computadora y un paquete de softwarpara estadiacutestica

SUGERENCIAS

Y

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2856

Ventas (doacutelares) Promoc (doacutelares) Compet Gratis

793 25 10 3

2001 55 8 6

1632 60 12 9

2001 79 7 16

1460 52 8 15

1777 76 12 9

309 20 12 8

2919 90 5 10

1600 40 8 43394 96 5 16

1596 55 11 7

863 30 12 6

2375 60 6 10

1072 50 10 4

1550 35 10 4

a) Utilice la siguiente salida de Minitab para determinar la ecuacioacuten de regresioacuten que mejor se ara la liacutenea aeacuterea

La ec uaci oacuten de r egr es i oacuten esVENTAS ϭ 172 ϩ 25 9 PROMOVϪ 13 2 COMPET Ϫ 3 04 GRATI S

Pr onos t i cador Coef Des vEs t Coci ent e - t Cons t ant e 172 34 51 38 3 35 0PROMOV 25 950 4 877 5 32 0COMPET - 13 238 3 686 - 3 59 0GRATI S - 3 041 2 342 - 1 30 0

b) iquestLos pasajeros que vuelan gratis ocasionan una disminucioacuten significativa en las ventas Fpruebe las hipoacutetesis apropiadas Use ϭ 005

c) iquestUn incremento de $1000 en las promociones cambia las ventas en $28000 o el cambio ecativamente diferente de $28000 Formule y pruebe las hipoacutetesis adecuadas Use ϭ 010

d) Calcule un intervalo de confianza del 90 para el coeficiente de la pendiente de la COMPET

Aplicaciones

13-22 Mark Lowtown publica el perioacutedico Mosquito Junction Enquirer y tiene problemas para predectidad de papel perioacutedico que necesita imprimir diariamente Eligioacute aleatoriamente 27 diacuteas del arior y registroacute la siguiente informacioacuten

PESO ϭ peso en libras de papel perioacutedico para la edicioacuten de ese diacutea

CLASIFICADOS ϭ nuacutemero de anuncios clasificados

PUBLICIDAD ϭ nuacutemero de anuncios publicitarios

PLANA COMPLETA ϭ nuacutemero de anuncios a una plana

Utilizando Minitab para hacer una regresioacuten de PESO sobre las otras tres variables Mark obtuguiente salida

Pr onos t i cador Coef Des vEs t Coci ent e- t Cons t ant e 1072 95 872 43 1 23 0CLASI FI CADOS 0 251 0 126 1 99 0PUBLI CI DAD 1 250 0 884 1 41 0PLANA COMPLETA 250 66 67 92 3 69 0

a) Mark siempre ha pensado que cada anuncio publicitario utiliza al menos 3 libras de papel iquestsioacuten le da una razoacuten significativa para dudar esto al nivel del 5

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2956

b) De manera similar Mark siempre ha creiacutedo que cada anuncio clasificado utiliza aproximmedia libra de papel iquestTiene ahora Mark una razoacuten significativa para dudar esto al nivel del

c) Mark vende espacios de anuncios de plana completa a los comerciantes locales a $30 la paacutegberaacute pensar en ajustar sus tarifas si el papel perioacutedico le cuesta $009 por libra Suponga costos son despreciables Establezca expliacutecitamente las hipoacutetesis y una conclusioacuten (Sugere

jando todo lo demaacutes constante cada anuncio adicional de plana completa tiene un costo de bras de papel ϫ $009 por libra ϭ $2256 El punto de equilibrio es 333333 libras iquestPor quel coeficiente de pendiente para PLANA COMPLETA es significativamente mayor que Mark no estaacute obteniendo ganancias y debe cambiar sus tarifas)

13-23 Para los datos del ejercicio 13-18 y un nivel de significancia de 010 iquestcuaacuteles variables son sign

mente explicativas de los resultados de los exaacutemenes (Habiacutea 12 estudiantes en la muestra) 13-24 Para los datos del ejercicio 13-18 y la siguiente salida de Minitab del procedimiento de regresiple hecho por Bill

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 3134 42 783 60Er r or 7 951 25 135 89Tot a l 11 4085 67

a) iquestCuaacutel es el valor observado de F b) A un nivel de significancia de 005 iquestcuaacutel es el valor criacutetico de F que se debe utilizar para d

si la regresioacuten como un todo es significativac) Basaacutendose en las respuestas a los incisos a) y b) iquestes la regresioacuten significativa como un tod

13-25 Remiacutetase al ejercicio 13-19 A un nivel de significancia de 001 iquestes la variable DISTANCIA uble explicativa significativa para VENTAS

13-26 Para los datos del ejercicio 13-19 y la siguiente salida adicional de Minitab al correr la regresioacuten

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 2861495 715374 102 39 0Er r or 18 125761 6896 7Tot a l 22 2987256

Al nivel de significancia de 005 iquestes la regresioacuten significativa como un todo

13-27 Henry Lander es el director de produccioacuten de la Alecos Corporation de Caracas Venezuela Hede que le ayude a determinar una foacutermula para predecir el ausentismo de los empacadores de chipoacutetesis es que la temperatura diaria promedio puede explicar el porcentaje de ausentismo Durios meses reuacutene datos ejecuta el procedimiento de regresioacuten simple y encuentra que la tempeplica 66 de la variacioacuten en el ausentismo Pero Henry no estaacute convencido de que eacuteste sea un cador satisfactorio Sugiere que la precipitacioacuten pluvial diaria podriacutea tambieacuten tener algo que vausentismo de modo que registra los datos correspondientes y hace una regresioacuten del ausentismte el tiempo de lluvias y obtiene un valor R2 de 059 ldquoiexclEurekardquo grita usted ldquoiexclLo tengo Con uticador que explica 66 y otro que explica 59 todo lo que tengo que hacer es una regresioacutenutilizando ambos y seguramente tendreacute un pronosticador casi perfectordquo Para su desaacutenimo sin la regresioacuten muacuteltiple tiene una R

2 de soacutelo 68 que es solamente un poco mejor que la variablperatura sola iquestCoacutemo puede explicar esta aparente discrepancia

13-28 Juan Armenlegg administrador de Rockyrsquos Diamond y Jewelry Store estaacute interesado en desamodelo para estimar la demanda del consumidor para su costosa mercanciacutea Como la mayoriacutea de

tes compran diamantes y joyas a creacutedito Juan estaacute seguro de que dos factores que deben influirmanda de los clientes son la tasa real de inflacioacuten anual y la tasa real de intereses sobre preacutestamprincipales bancos del paiacutes Explique algunos problemas que Juan podriacutea encontrar si fuera a dun modelo de regresioacuten basado en estas dos variables de prediccioacuten

13-29 Un nuevo programa de juegos Check That Model pide a los concursantes que especifiquen el nuacutenimo de paraacutemetros que necesitan para determinar si un modelo de regresioacuten muacuteltiple es signifimo un todo para ϭ 001 Usted ganoacute la apuesta con 4 paraacutemetros Use la siguiente informacioacutenterminar si la regresioacuten es significativa

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3056

R 2

ϭ 07452

SCE ϭ 1254

n ϭ 18

Nuacutemero de variables independientes ϭ 3

13-30 La Scottish Turist Agency estaacute interesada en el nuacutemero de turistas que entran al paiacutes cada semanrante la temporada alta Se recolectaron los siguientes datos

Turistas (Y ) ϭ nuacutemero de turistas que entran a Escocia en una semana (en miles)

Cambio (X 1)ϭ nuacutemero de libras escocesas compradas por $1 doacutelar

Precio (X 2) ϭ nuacutemero de libras escocesas cobradas por viaje redondo en camioacuten de Londres a Edimburgo

Promoc (X 3) ϭ cantidad gastada en promocioacuten del paiacutes (en miles de libras escocesas)Temp (X 4) ϭ temperatura media durante la semana en Edimburgo (en grados Celsius)

Turistas (Y ) Cambio (X 1) Precio (X 2) Promoc (X 3) Temp (X 4)

69 061 40 87 154

71 059 40 88 156

68 063 40 85 154

79 061 35 86 153

76 060 35 94 158

82 065 35 99 162

80 058 35 98 164

84 059 35 102 166

97 061 30 114 174

98 062 30 116 172

72 057 40 84 176

67 055 40 86 164

a) Utilice el paquete de software que tenga para determinar la ecuacioacuten de regresioacuten que mejote a los datos de la agencia de turismo

b) iquestEs la tasa de cambio una variable explicativa significativa Establezca y pruebe las hipoacutetesidas a un nivel de significancia de 010

c) Un incremento de 1000 libras en las promociones iquestaumenta el nuacutemero de turistas en maacutesEstablezca y pruebe las hipoacutetesis adecuadas para un nivel de significancia de 005

d) Calcule un intervalo de confianza del 95 para el coeficiente de la pendiente de Temp

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-4 Como SCT ϭ SCR ϩ SCE SCE ϭ SCT Ϫ SCR ϭ 10236 Ϫ 8724 ϭ 1512Como gl SCT ϭ gl SCR ϩ gl SCE gl SCR ϭ gl SCT Ϫ gl SCE ϭ 24 Ϫ 17 ϭ 7

Entonces F ϭ ϭ ϭ 1401

F CRiacuteT ϭ F (7 17 005) ϭ 261Como F OBS gt F CRIacuteT se concluye que la regresioacuten es significativa como un todo Edith debe conticando la salida de computadora de la regresioacuten para usarla en la junta

EA 13-5 De la salida de computadora se obti enen los siguientes resultadosa) VENTAS ϭ 17234 ϩ 25950PROMOC Ϫ13238COMPET Ϫ 3041GRATISb) H0 BGRATIS ϭ 0 H1 BGRATIS Ͻ 0 ϭ 005

Eacutesta es una prueba de una cola y el valor prob en los resultados es para la alternativa de dos c BGRATIS 0 De manera que para esta prueba el valor prob es 02212 ϭ 0111 Ͼ ϭ 00que no se puede rechazar H0 las ventas no disminuyen significativamente cuando aumenta ro de pasajeros que vuelan gratis

c) H0 BPROMOC ϭ 28 H1 BPROMOC 28 ϭ 010

87247ᎏᎏ

151217SCRk ᎏᎏ

SCE(n Ϫ k Ϫ 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3156

El valor observado t de los resultados de regresioacuten es

ϭ ϭ Ϫ0420

Con 11 grados de libertad y ϭ 010 en ambas colas combinadas los valores criacuteticos t parba son Ϯ1796 asiacute el valor observado estaacute dentro de la regioacuten de aceptacioacuten No se rechacambio en VENTAS para un incremento de una unidad ($1000) en PROMOC no es significate diferente de 28 ($28000)

d) Con 11 grados de libertad el valor t para un intervalo del 90 de confianza es 1796 por lo

tervalo esbCOMP Ϯ 1796sbCOMP

ϭ Ϫ13238 Ϯ 1796(3686)

ϭ Ϫ13238 Ϯ 6620 ϭ (Ϫ19858 Ϫ 6618)

La liacutenea aeacuterea puede tener una seguridad del 90 de que el ingreso por los boletos en una ofminuye entre $6600 y $19900 aproximadamente con cada liacutenea aeacuterea adicional que comp

135 Teacutecnicas de modelado

Dada una variable que deseamos explicar y un conjunto de variables explicativas potencialehaya varias ecuaciones de regresioacuten diferentes que podamos estudiar dependiendo de queacute explicativas incluyamos y de coacutemo lo hagamos Cada una de esas ecuaciones de regresioacutence como modelo Las teacutecnicas de modelado son las distintas formas en que podemos incluriables explicativas y verificar queacute tan apropiados son los modelos de regresioacuten Existen municas de modelado diferentes pero soacutelo veremos dos de las maacutes utilizadas

Datos cualitativos y variables ficticias

En todos los ejemplos de regresioacuten que hemos visto hasta ahora los datos manejados hanmeacutericos o cuantitativos Pero ocasionalmente nos enfrentaremos con una variable categoacuterilitativa En el problema del inicio el capiacutetulo el director de personal desea ver si el salarioun vendedor depende de su sexo En la tabla 13-5 repetimos los datos de dicho problema

Por el momento ignore la antiguumledad y utilice la teacutecnica desarrollada en el capiacutetulo 9 bar la diferencia entre las medias de dos poblaciones para ver si los hombres ganan maacutes qu

jeres Pruebe con ϭ 001 Si tomamos a los hombres como la poblacioacuten 1 y a las mujerespoblacioacuten 2 probaremos las siguientes hipoacutetesis

H0 1 ϭ 2 larr Hipoacutetesis nula no existe discriminacioacuten por sexo en los salarios base

H1 1 Ͼ 2 larr Hipoacutetesis alternativa se discrimina a las mujeres en su salario base

ϭ 001 larr Nivel de significancia

Revisioacuten del enfoqueanterior del problema

Buacutesqueda dediferentes modelos

25950 Ϫ 28ᎏᎏ

4877

(bPROMOC Ϫ 28)ᎏᎏ

sbPROMOC

Datos para el problemade discriminacioacuten porsexo

Tabla 13-5 Vendedores VendedorasAntiguumledad Salario base Antiguumledad Salario base(en meses) (en miles) (en meses) (en miles)

6 75 5 62

10 86 13 87

12 91 15 94

18 103 21 98

30 130

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3256

A continuacioacuten bosquejamos el anaacutelisis Si tiene problemas para seguirlo deberaacute repasamente la seccioacuten 93

n1 ϭ 5 n2 ϭ 4

x ෆ1 ϭ 97 x ෆ2 ϭ 8525

s2

1 ϭ 4415 s2

2 ϭ 2609

s2

p ϭ

ϭ

ϭ 3641

x ෆ1Ϫ x

ෆ2ϭ s pΊ ϩ

ϭ 128

t ϭ

ϭ

ϭ 092

Con siete grados de libertad el valor t criacutetico para una prueba de cola superior con ϭ 001 eComo el valor t observado de 092 es menor que 2998 no podemos rechazar H0

Entonces el anaacutelisis concluye que no parece haber discriminacioacuten por sexo en los salarPero recuerde que hasta ahora se han ignorado los datos de antiguumledad laboral para el anaacuteli

Antes de seguir vea el diagrama de dispersioacuten de los datos En la figura 13-9 los punto

corresponden a los hombres y los blancos a las mujeres El diagrama de dispersioacuten muestraridad que el salario base aumenta con los antildeos de antiguumledad pero si con la mirada sigue lo qla recta de regresioacuten notaraacute que los puntos negros tienden a estar arriba de ella y los blancos

La figura 13-10 da la salida de una regresioacuten del salario base sobre los meses de antiguumlelos resultados se ve que la antiguumledad es una variable explicativa altamente significativa

Ademaacutes r 2

ϭ 926 que indica que la variable meses de antiguumledad explica cerca del 9variacioacuten en el salario base La figura 13-11 contiene parte de la salida que no se vio antesbla de residuos Para cada punto el residuo es simplemente Y Ϫ Y ˆ que se reconoce como el

Una ldquomiradardquo a los

datos

El enfoque anterior nodetecta discriminacioacuten

(97 ndash 8525) ndash 0ᎏᎏ

128

( x ෆ1 ndash x ෆ2) ndash (1 Ϫ 2)H0

ᎏᎏᎏ

ˆ x ෆ1Ϫ

x ෆ2

1ᎏ

n2

1ᎏ

n1

4(4415) ϩ 3(2609)ᎏᎏᎏ5 ϩ 4 ndash 2

(n1 ndash 1)s21 ϩ (n2 ndash 1)s22ᎏᎏᎏ

n1 ϩ n2 ndash 2

FIGURA 13-9

Diagrama de dis-persioacuten de salariosbase contra mesesde antiguumledad

4 8 12 16 20 24 28

4

8

12

Meses de antiguumledad

S a l a r i o ( m i l e s d e d oacute l a r e s )

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3356

el ajuste de la recta de regresioacuten en ese punto En la figura 13-11 AJUST1 son los valores y RESI1 son los residuos

Tal vez la parte maacutes importante del anaacutelisis del resultado de una regresioacuten sea estusiduos Si la regresioacuten incluye todos los factores explicativos relevantes estos residuo

ser aleatorios Dicho de otro modo si los residuos muestran cualquier patroacuten no aleat

to indica que hay algo sistemaacutetico que afecta el proceso y que no hemos tomado en cu

manera que buscamos patrones en los residuos o para decirlo de forma maacutes pintoresca ldquopmos a los residuos hasta hacerlos hablarrdquo

Si observamos los residuos presentados en la figura 13-11 vemos que los primeros cincoson positivos De modo que para los vendedores tenemos Y ndash Y ˆ Ͼ 0 o Y Ͼ Y ˆ es decir laregresioacuten cae abajo de estos cinco puntos Tres de los cuatro uacuteltimos residuos son negaticonsiguiente para las vendedoras tenemos Y Ϫ Y ˆ Ͻ 0 o Y Ͻ Y ˆ asiacute que la recta de regresicuentra arriba de tres de los cuatro puntos Esto confirma lo que vimos al observar el diagdispersioacuten de la figura 13-9 Este patroacuten no aleatorio en los residuos sugiere que el sexo siacute etor determinante del salario base

iquestCoacutemo podemos incorporar el sexo de los vendedores dentro del modelo de regresioacutencemos utilizando un dispositivo llamado variable ficticia (o variable indicadora) Para lpuntos que representan a los vendedores esta variable tiene valor de 0 y para los cuatro purepresentan a las vendedoras valdraacute 1 Los datos de entrada para nuestra regresioacuten con variticias se dan en la tabla 13-6

Para los datos de la tabla 13-6 se ajusta una regresioacuten de la forma

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

Uso de variablesficticias

Deteccioacuten depatrones en losresiduos

ldquoPresionar a losresiduosrdquo

Anaacutel i s i s de r e gr e s i oacuten

La ec uac i oacuten de r e gr es i oacuten esSALARI O ϭ 5 81 ϩ 0 233 MESES

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t pCons t a nt e 5 8093 0 4038 14 39 0 000MESES 0 23320 0 02492 9 36 0 000

s ϭ 0 5494 R- s q ϭ 92 6

Anaacute l i s i s de va r i a nz aFUENTE GL SC MC F Re gr e s i oacuten 1 26 443 24 443 87 61 0Er r or 7 2 113 0 302Tot a l 8 28 556

FIGURA 13-10

Regresioacuten conMinitab del salariobase sobre losmeses deantiguumledad

RENGLOacuteN SALARI O AJ UST1 RESI 1

1 7 5 7 2085 0 2914992 8 6 8 1413 0 458684

3 9 1 8 6077 0 4922764 10 3 10 0069 0 2930545 13 0 12 8054 0 1946076 6 2 6 9753 - 0 7752977 8 7 8 8409 - 0 1409288 9 4 9 3073 0 0926649 9 8 10 7066 - 0 906558

FIGURA 13-11

Tabla de residuosde Minitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1556

13-15 Dado el siguiente conjunto de datos utilice el paquete de software que tenga a su disposicioacuten patrar la ecuacioacuten de regresioacuten de mejor ajuste y responda a lo siguientea) iquestCuaacutel es la ecuacioacuten de regresioacutenb) iquestCuaacutel es el error estaacutendar de la estimacioacutenc) iquestCuaacutel es el valor de R2 para esta regresioacutend) Deacute un intervalo de confianza para la estimacioacuten del 95 para el valor Y cuando los valores X

y X 4 son 524 416 358 y 3 respectivamente

X 1 X 2 X 3 X 4 Y

214 629 219 Ϫ2 228

517 407 429 5 937418 818 698 2 649

118 410 909 Ϫ4 192

716 226 129 8 558

919 615 309 1 231

Aplicaciones

1316 Las estaciones de policiacutea en Estados Unidos estaacuten interesadas en predecir el nuacutemero de arrestodos que deberaacuten procesar cada mes para programar mejor a los empleados de oficina En los daricos el nuacutemero promedio de arrestos (Y ) cada mes tiene influencia del nuacutemero de oficiales en

policiaca ( X 1) la poblacioacuten de la ciudad en miles ( X 2) y el porcentaje de personas desempleadasdad en miles ( X 3) Los datos de estos factores en 15 ciudades se presentan en la tablaa) Utilice el paquete de software que tenga disponible para determinar la ecuacioacuten de regresioacuten

jor se ajuste a estos datosb) iquestQueacute porcentaje de la variacioacuten total en el nuacutemero de arrestos (Y ) explica esta ecuacioacutenc) El departamento de policiacutea de ChapelBoro desea pronosticar el nuacutemero de arrestos mensua

pelBoro tiene una poblacioacuten de 75000 habitantes 82 elementos en su fuerza policiaca y utaje de desempleo del 105 iquestCuaacutentos arrestos pronostica para cada mes

Nuacutemero promedio Nuacutemero de oficiales Tamantildeo de la ciudad (X 2) Porcende arrestos mensuales (Y ) en la fuerza (X 1) en miles de habitantes desemp

3906 68 816 4

5043 94 751 3

6284 125 973 5

7456 175 1235 8

5852 113 1184 11

4503 82 654 9

3278 46 616 12

2605 32 543 18

4775 89 974 4

3898 67 824 6

3124 47 564 8

3675 59 713 7

3744 61 674 9

4946 87 963 11

4875 92 864 4

13-17 Estamos intentando predecir la demanda anual (DEMAND) de cierto producto utilizando las svariables independientes

PRECIO ϭ precio del producto (en doacutelares)

INGRESO ϭ ingreso del consumidor (en doacutelares)

SUB ϭ precio de un bien sustituto (en doacutelares)

( Nota Un bien sustituto es aquel que puede suplir a otro bien Por ejemplo la margarina es untituto de la mantequilla)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1656

Se recolectaron datos correspondientes al periodo 1982-1996

Antildeo Demanda Precio ($) Ingreso ($) Sub ($)

1982 40 9 400 101983 45 8 500 141984 50 9 600 121985 55 8 700 131986 60 7 800 111987 70 6 900 151988 65 6 1000 161989 65 8 1100 17

1990 75 5 1200 221991 75 5 1300 191992 80 5 1400 201993 100 3 1500 231994 90 4 1600 181995 95 3 1700 241996 85 4 1800 21

a) Utilice el paquete de software que tenga disponible para encontrar la ecuacioacuten de regresioacuten ajuste para estos datos

b) iquestSon los signos (ϩ o Ϫ) de los coeficientes de regresioacuten de las variables independientes los qperan Deacute una explicacioacuten breve ( Nota Eacutesta no es una pregunta estadiacutestica soacutelo necesita pesignifican los coeficientes de regresioacuten)

c) Establezca e interprete el coeficiente de determinacioacuten muacuteltiple del problemad) Establezca e interprete el error estaacutendar de la estimacioacuten para el problemae) Seguacuten la ecuacioacuten de regresioacuten obtenida iquestqueacute valor de DEMAND predeciriacutea si el precio de

ductos fue $6 el ingreso del consumidor $1200 y el precio del bien sustituto $17 13-18 Bill Buxton profesor de estadiacutestica de una prominente escuela de administracioacuten tiene un prof

tereacutes en los factores que afectan el desempentildeo de los estudiantes en los exaacutemenes El examen psemestre anterior tuvo una distribucioacuten de calificaciones amplia pero Bill tiene la certeza de qfactores explican esa distribucioacuten permite a sus estudiantes que estudien en tantos libros comoca el coeficiente de inteligencia de los estudiantes variacutea tienen distintas edades y difieren losque dedican a estudiar Con el propoacutesito de desarrollar una foacutermula de prediccioacuten para las califde los exaacutemenes Bill pidioacute a cada estudiante que respondiera al final del examen preguntas refe

tiempo de estudio y nuacutemero de libros utilizados Los registros que teniacutea Bill ya incluiacutean el coefiinteligencia y la edad de modo que reunioacute los datos del grupo y corrioacute la regresioacuten muacuteltiple deLa salida de la corrida de Bill fue la siguiente

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t Con s t a nt e minus49 948 41 55 minus1 20 0HORAS 1 06931 0 98163 1 09 0CI 1 36460 0 37627 3 63 0LI BROS 2 03982 1 50799 1 35 0EDAD minus1 79890 0 67332 minus2 67 0

s = 11 657 R- s q = 76 7

a) iquestCuaacutel es la ecuacioacuten de regresioacuten de mejor ajuste para estos datos

b) iquestQueacute porcentaje de la variacioacuten en las calificaciones se explica con esta ecuacioacutenc) iquestQueacute calificacioacuten esperariacutea usted para un estudiante de 21 antildeos de edad con un coeficiente gencia (CI) de 113 que estudioacute durante cinco horas y utilizoacute tres libros diferentes

13-19 La compantildeiacutea de tiendas de abarrotes Twenty-Two estaacute planeando expandir su cadena Como ayudleccionar los lugares donde abriraacute las nuevas tiendas recolectoacute datos de las ventas semanales de casus 23 tiendas Para explicar la variabilidad de las ventas semanales tambieacuten reunioacute informacioacutencribe cuatro variables que se cree estaacuten relacionadas con las ventas Las variables se definen como

VENTAS ϭ ventas semanales promedio en cada tienda en miles de doacutelares

AUTOS ϭ volumen promedio de traacutensito de automoacuteviles por semana en miles de autos

ENTRADA ϭ facilidad de entradasalida medida en una escala de 1 a 100

INGANUAL ϭ ingreso anual promedio por familia en el aacuterea en miles de doacutelares

DISTANCIA ϭ distancia en millas desde la tienda al supermercado maacutes cercano

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1756

Los datos se analizaron con Minitab y la salida es la siguiente

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t Cons t a nt e 175 37 92 62 1 89 0 0AUTOS - 0 028 0 315 minus0 09 0 9ENTRADA 3 775 1 272 2 97 0 0I NGANUAL 1 990 4 510 0 44 0 6DI STANCI A 212 41 28 090 7 56 0 0

s = 85 587 R- s q = 95 8

a) iquestCuaacutel es la ecuacioacuten de regresioacuten de mejor ajuste dada por Minitab

b) iquestCuaacutel es el error estaacutendar de la estimacioacuten para esta ecuacioacutenc) iquestQueacute fraccioacuten de la variacioacuten en las ventas se explica con esta regresioacutend) iquestQueacute ventas predeciriacutea para una tienda localizada en un vecindario que tuvo un ingreso anu

milia de $20000 estaba a 2 millas del supermercado maacutes cercano se encontraba en una calvolumen promedio semanal de traacutensito de 100000 autos y con una facilidad de entrada de

13-20 Rick Blackburn estaacute pensando en vender su casa Con el fin de decidir el precio que pediraacute poreunido datos de 12 ventas recientes Registroacute el precio de venta (en miles de doacutelares) el nuacutemercuadrados de construccioacuten (en cientos de pies cuadrados) el nuacutemero de pisos el nuacutemero de bantiguumledad de la casa (en antildeos)

Precio de venta Pies cuad Pisos Bantildeos Antiguumledad

4965 89 1 10 2

6795 95 1 10 68115 126 2 15 11

8160 129 2 15 8

9150 190 2 10 22

9525 176 1 10 17

10035 200 2 15 12

10425 206 2 15 11

11265 205 1 20 9

14970 251 2 20 8

16065 227 2 20 18

23250 408 3 40 12

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de

de mejor ajuste para los datosb) iquestCuaacutel es el valor de R2 para esta ecuacioacutenc) Si la casa de Rick tiene 1800 pies cuadrados (ϭ 180 cientos de pies cuadrados) un piso

y seis antildeos de antiguumledad iquestqueacute precio de venta puede esperar Rick 13-21 La Allegheny Steel Corporation ha estado buscando los factores que influyen en la cantidad de

millones de toneladas) que puede vender cada antildeo La administracioacuten sospecha que los siguientfactores principales la tasa anual de inflacioacuten del paiacutes el precio promedio por tonelada del acetado que acota los precios (en doacutelares) de Allegheny y el nuacutemero de automoacuteviles (en millonesfabricantes de autos de Estados Unidos planean producir ese antildeo Se recolectaron los datos de losiete antildeos

Y X 2 X 3

Millones X 1 Cota de Nuacutemero

de tons Tasa de importa- deAntildeo vendidas inflacioacuten ciones automoacuteviles

1993 42 31 310 62

1992 31 39 500 51

1991 40 75 220 57

1990 47 107 450 71

1989 43 155 435 65

1988 37 130 260 61

1987 35 110 305 59

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1856

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de regresioacutende mejor ajuste para los datos

b) iquestQueacute porcentaje de la variacioacuten total de la cantidad de acero vendido (en millones de toneladas) porAllegheny cada antildeo explica esta ecuacioacuten

c) iquestCuaacutentas toneladas de acero deberaacute esperar Allegheny vender en un antildeo en el que la tasa de inflacioacutenes 71 los fabricantes de automoacuteviles norteamericanos planean producir 60 millones de autos y la co-ta promedio del acero importado por tonelada es $350

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-3 De la salida del paquete de software se obtienen los siguientes resultadosa) Y ˆ ϭ Ϫ1275 ϩ 17059 X 1 ϩ 05406 X 2 Ϫ 01743 X 3b) R

2ϭ 872 el modelo explica el 872 de la variacioacuten total en Y

c) Y ˆ ϭ Ϫ1275 ϩ 17059(169) ϩ 05406(10212) Ϫ 01743(26925) ϭ 2436 reembolsos de impuestos

134 Inferencias sobre paraacutemetrosde poblacioacuten

En el capiacutetulo 12 se vio que la recta de regresioacuten de la muestra Y ˆ ϭ a ϩ bX (ecuacioacuten 12-3) esti-maba la recta de regresioacuten de la poblacioacuten Y ϭ A ϩ BX (ecuacioacuten 12-13) La razoacuten por la cual soacute-lo podiacuteamos estimar la recta de regresioacuten de poblacioacuten y no determinarla con exactitud era que los

puntos no caen exactamente en la recta de regresioacuten de la poblacioacuten Debido a las variaciones alea-torias los puntos satisfaciacutean Y ϭ A ϩ BX ϩ e (ecuacioacuten 12-13a) maacutes que a Y ϭ A ϩ BX

En la regresioacuten muacuteltiple se tiene justo la misma situacioacuten Nuestro plano de regresioacuten estimado

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k [13-5]

es una estimacioacuten de un plano de regresioacuten de poblacioacuten verdadero pero desconocido de la forma

Plano de regresioacutende la poblacioacuten

De nuevo los puntos individuales normalmente no caen con exactitud en el plano de regresioacuten depoblacioacuten Consideremos el problema del Servicio Interno de Contribuciones para ver por queacute Notodos los pagos a informantes tendraacuten la misma efectividad Algunas horas en computadora podriacuteanutilizarse para recolectar y organizar datos otras para analizar esos datos en busca de errores y frau-des El eacutexito de la computadora en descubrir impuestos no pagados puede depender de cuaacutento tiempose dedique a cada una de estas actividades Por eacutestas y otras razones algunos de los puntos se en-contraraacuten arriba del plano de regresioacuten y algunos estaraacuten abajo de eacuteste En lugar de satisfacer laecuacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

los puntos individuales satisfaraacuten la ecuacioacuten

Las variaciones alea-torias desplazan lospuntos del plano deregresioacuten

Ecuacioacuten de regresioacuten de la poblacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

Plano de regresioacuten de la poblacioacuten maacutes la variacioacuten aleatoria

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e [13-7a]

La cantidad e que aparece en la ecuacioacuten 13-7a es una variacioacuten aleatoria que en promedio es iguala cero La desviacioacuten estaacutendar de las variaciones individuales e y el error estaacutendar de la estima-cioacuten se que estudiamos en la seccioacuten anterior es una estimacioacuten de e

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1956

Como nuestro plano de regresioacuten de la muestra Y ˆ ϭ a ϩ b1X1 ϩ b2 X 2 ϩ ϩ bk X k (ecuaci13-7) estima el plano de regresioacuten de poblacioacuten desconocido Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk

(ecuacioacuten 13-7) deberemos ser capaces de usarlo para hacer inferencias sobre el plano de regreside la poblacioacuten En esta seccioacuten haremos inferencias acerca de las pendientes ( B1 B2 Bk ) deecuacioacuten de regresioacuten ldquoverdaderardquo (la que se aplica a la poblacioacuten completa) basadas en las pendietes (b1 b2 bk ) de la ecuacioacuten de regresioacuten estimada a partir de la muestra de datos

Inferencias acerca de una pendiente individual B i El plano de regresioacuten se deriva de una muestra y no de la poblacioacuten completa Como resultado

podemos esperar que la ecuacioacuten de regresioacuten verdadera Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k que se aplica a la poblacioacuten completa) sea exactamente igual que la ecuacioacuten estimada a partir observaciones de la muestra Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k Sin embargo podemos utilizarvalor de bi una de las pendientes que calculamos a partir de la muestra para probar hipoacutetesis acca del valor de Bi una de las pendientes del plano de regresioacuten para la poblacioacuten completa

El procedimiento para probar una hipoacutetesis respecto a Bi es parecido al procedimiento analizaen los capiacutetulos 8 y 9 sobre pruebas de hipoacutetesis Para entender este proceso regresemos al probma que relaciona los impuestos no pagados descubiertos con las horas de trabajo en auditoriacuteas campo horas en computadora y recompensas a informantes En la paacutegina 729 sentildealamos que b10597 El primer paso consiste en encontrar un valor para B1 y compararlo con b1 ϭ 0597

Suponga que durante un periodo largo la pendiente de la relacioacuten entre Y y X 1 fue 0400 Paprobar si todaviacutea es vaacutelida podriacuteamos definir las hipoacutetesis como

H0 B1 ϭ 0400 larr Hipoacutetesis nula

H1 B1 0400 larr Hipoacutetesis alternativa

De hecho realizamos la prueba para saber si los datos actuales indican que B1 ha cambiado su vahistoacuterico de 0400

Para encontrar el estadiacutestico de prueba para B1 es necesario hallar primero el error estaacutendar d

coeficiente de regresioacuten El coeficiente de regresioacuten con el que estamos trabajando es b1 de moque el error estaacutendar de este coeficiente se representa con sb1

Resulta demasiado difiacutecil calcular sb1 a mano pero por fortuna Minitab calcula los errores estaacutedar de todos los coeficientes de regresioacuten Por comodidad repetimos la figura 13-2 Los errores taacutendar de los coeficientes se dan en la columna DesvEst de la salida de Minitab

En el cuadro de salida vemos que sb1

es 00811 (Similarmente si deseamos probar una hipoacutesis acerca de B2 vemos que el error estaacutendar apropiado que debemos utilizar es sb2 ϭ 00841) Uvez que encontramos sb1 en la salida de Minitab podemos usar la ecuacioacuten 13-8 para estandarizarpendiente de nuestra ecuacioacuten de regresioacuten ajustada

Estandarizacioacutendel coeficiente deregresioacuten

Error estaacutendar delcoeficientede regresioacuten

Prueba de unahipoacutetesis acerca de B i

Diferencia entre la

ecuacioacuten de regre-sioacuten verdadera y unaestimada a partir delas observacionesde la muestra

Coeficiente de regresioacuten estandarizado

t ϭ [13-8bi ndash Bi0ᎏ

sbi

donde

bull biϭ pendiente de la regresioacuten ajustada

bull Bi0 ϭ pendiente real hipoteacutetica para la poblacioacutenbull sbi ϭ error estaacutendar del coeficiente de regresioacuten

iquestPor queacute utilizamos t para denotar el estadiacutestico estandarizado Recuerde que en la regresioacuten siple utilizamos a y b en la ecuacioacuten 12-7 para calcular se y que se estimaba e la desviacioacuten estaacutedar de las variaciones de los datos (ecuacioacuten 12-13a) Entonces utilizamos se en la ecuacioacuten 12-para encontrar sb el error estaacutendar del coeficiente de regresioacuten que corresponde a la pendiente E

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2056

pezamos con n puntos y los usamos para estimar los dos coeficientes a y b Luego basamtras pruebas en la distribucioacuten t con n Ϫ 2 grados de libertad

De manera similar en la regresioacuten muacuteltiple tambieacuten empezamos con n puntos pero lospara estimar k ϩ 1 coeficientes la ordenada a y k pendientes b1 b2 bk Despueacutes estcientes se usan en la ecuacioacuten 13-6 para calcular se que de nuevo es una estimacioacuten de eviacioacuten estaacutendar de las variaciones de los datos (ecuacioacuten 13-7a) Luego se utiliza se (en ucioacuten que estaacute maacutes allaacute del alcance de este libro) para encontrar s

bi Debido a lo anterior

nuestras pruebas de hipoacutetesis en la distribucioacuten t con n Ϫ k Ϫ 1 (ϭ n Ϫ ( k ϩ l)) grados de En nuestro ejemplo el valor estandarizado del coeficiente de regresioacuten es

t ϭ

ϭ

ϭ 2432 larr Coeficiente de regresioacuten estandarizado

Suponga que estamos interesados en probar nuestras hipoacutetesis al nivel de significancia

Como tenemos 10 observaciones en la muestra y tres variables independientes sabemos n Ϫ k Ϫ 1 o 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad Buscamos en la tabla 2 del apeacutendice en lana de 10 y el rengloacuten de 6 grados de libertad Ahiacute vemos que el valor apropiado de t es 19mo nos preocupa si b1 (la pendiente del plano de regresioacuten de la muestra) es significativamferente de B1 (la pendiente hipoteacutetica del plano de regresioacuten de la poblacioacuten) eacutesta es una pdos colas y los valores criacuteticos son Ϯ1943 El coeficiente de regresioacuten estandarizado es 2se encuentra fuera de la regioacuten de aceptacioacuten de nuestra prueba de hipoacutetesis Por consiguichazamos la hipoacutetesis nula de que B1 todaviacutea es igual a 0400 En otras palabras existe unacia suficientemente grande entre b1 y 0400 para concluir que B1 ha cambiado respecto a histoacuterico Por esto sentimos que cada 100 horas adicionales de trabajo en auditoriacuteas de camaumentan la cantidad de descubrimientos de impuestos no pagados en $400000 como lo hel pasado

Ademaacutes de la prueba de hipoacutetesis podemos construir un intervalo de confianza para cude los valores de Bi Del mismo modo que bi es una estimacioacuten puntual de Bi estos intervalofianza son estimaciones de intervalo de Bi Para ilustrar el proceso de construccioacuten de interconfianza encontremos un intervalo de confianza del 95 para B3 en el ejemplo del IRS Lrelevantes son

b3 ϭ 0405 de la figura 13-2sb3 ϭ 00422

t ϭ 2447 larr Nivel de significancia del 5 y 6 grados de libertad

Intervalo deconfianza para B i

Realizacioacuten de la

prueba de hipoacutetesis

0597 ndash 0400ᎏᎏ

0081

b1 ndash B10ᎏ

sb1

Anaacute l i s i s de r e gr e s i oacutenLa ec uaci oacuten de r egr es i oacuten esDESCUBRE = - 45 0 + 0 597 AUDI TORIacute A + 1 18 COMPUTADORA + 0 405 RECOMPENSA

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 45 796 4 878 - 9 39 0 000AUDI TORIacute A 0 50697 0 08112 7 36 0 000COMPUTADORA 1 17684 0 08407 14 00 0 000RECOMPENSAS 0 40511 0 04223 9 59 0 000

s = 0 2861 R- s q = 98 3

FIGURA 13-2

Salida de Minitab(figura repetida)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2156

Con esta informacioacuten podemos calcular el intervalo de confianza de la siguiente manera

b3 ϩ t (sb3) ϭ 0405 ϩ 2447(00422)

ϭ 0508 larr Liacutemite superior

b3 Ϫ t (sb3) ϭ 0405 Ϫ 2447(00422)

ϭ 0302 larr Liacutemite inferior

Vemos que podemos tener una seguridad del 95 de que cada $1000 adicionales pagados a los formantes aumenta el descubrimiento de impuestos no pagados en una cantidad entre $302000$508000

A menudo estaremos interesados en preguntas del tipo iquesten realidad Y depende de X i Por ejeplo podriacuteamos preguntar si descubrir impuestos no pagados en realidad depende de las horas encomputadora Con frecuencia esta pregunta se plantea como iquestes X i una variable explicativa sigficativa de Y Si piensa un poco maacutes se convenceraacute de que si Bi 0 Y depende de las X i (esto esvariacutea cuando X i variacutea) y no depende de X i si Bi ϭ 0

Vemos que nuestra pregunta conduce a establecer hipoacutetesis de la forma

H0 Bi ϭ 0 larr Hipoacutetesis nula X i no es una variable explicativa significativa

H1 Bi 0 larr Hipoacutetesis alternativa X i es una variable explicativa significativa

Podemos probar estas hipoacutetesis utilizando la ecuacioacuten 13-8 del mismo modo que cuando probamnuestras hipoacutetesis acerca de si B1 todaviacutea era igual a 0400 Sin embargo existe una forma maacutes faacutede hacerlo usando la columna de la figura 13-2 de ldquocociente- t rdquo Observemos de nuevo la ecuaci13-8

t ϭ [13-

Como nuestro valor hipoteacutetico de Bi es cero el valor estandarizado del coeficiente de regresioacutedenotado por t o se convierte en

t o ϭ

El valor de t o se conoce como valor t ldquocalculadordquo Eacuteste es el nuacutemero que aparece en la columna equetada como ldquocociente-t rdquo en la figura 13-2 Denotemos por t c el valor t ldquocriacuteticordquo que buscamos

la tabla 2 del apeacutendice Entonces como la prueba para determinar si X i es una variable explicatisignificativa es una prueba de dos colas soacutelo necesitamos verificar si Ϫt c Յ t o Յ t c

Uso de valores t

calculados en lasalida de Minitab

biᎏ

sbi

bi ndash Bi0ᎏ

sbi

iquestEs significativa unavariable explicativa

Prueba para determinar si una variable es o no significativa

Ϫt c Յ t o Յ t c [13-9

donde

bull t c ϭ valor t adecuado (con n Ϫ k Ϫ 1 grados de libertad) para el nivel de significancia deprueba

bull t o ϭ bi sbi ϭ valor t observado (o calculado) obtenido con el paquete de software

Si t o

cae entre Ϫt c

y t c aceptamos H0 y llegamos a la conclusioacuten de que X

ino es una variable exp

cativa significativa En cualquier otro caso rechazamos H0 y concluimos que X i es una variable eplicativa significativa

Probemos al nivel de significancia de 001 si las horas en computadora constituyen una variabexplicativa significativa para los impuestos no pagados descubiertos De la tabla 2 del apeacutendice cn Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad y ϭ 001 vemos que t c ϭ 3707 De la figura 13tenemos que t o = 1400 Como t o Ͼ t c concluimos que el tiempo en computadora es una variab

Prueba de lasignificancia de lavariable horas decomputadora en elproblema del IRS

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2256

explicativa significativa De hecho al observar los valores t calculados para las otras dos vindependientes (tiempo de auditoriacuteas de campo t o ϭ 736 y recompensa a informantes t ovemos que tambieacuten son variables explicativas significativas

Podemos tambieacuten utilizar la columna de ldquoprdquo para probar si X i es una variable explicativacativa De hecho utilizando esa informacioacuten ni siquiera necesitamos usar la tabla 2 del aLos elementos de esta columna son los valores prob para las hipoacutetesis

H0 Biϭ 0

H1 Bi 0

Recuerde del anaacutelisis hecho en el capiacutetulo 9 que estos valores prob constituyen la probabque cada bi esteacute tan lejos de cero como (o maacutes) el valor observado obtenido de la regresioacutenverdadera Como se ilustra en la figura 13-3 solamente necesitamos comparar estos valocon el nivel de significancia de la prueba para determinar si X i es o no una variable expsignificativa para Y

Probar la significancia de una variable explicativa es siempre una prueba de dos colas Lble independiente X i es una variable explicativa significativa si bi es significativamente dife

cero es decir si t o es un nuacutemero grande positivo o negativoPara el ejemplo del IRS repetimos las pruebas con ϭ 001 Para cada una de las tres v

independientes p es menor que 001 de forma que podemos concluir que cada una de ellanificativa

Inferencias acerca de la regresioacuten como un todo

(usando una prueba F )

Suponga que cubre con papel un tablero para dardos y lanza varios dardos sobre eacutel Despueacuteberlo hecho tendraacute algo muy parecido a un diagrama de dispersioacuten Suponga entonces quuna recta de regresioacuten a este conjunto de ldquopuntos observadosrdquo y calcula r

2 Debido a que lofueron lanzados aleatoriamente usted espera obtener un valor bajo de r

2 puesto que en esten realidad no explica a Y Sin embargo si hace esto muchas veces ocasionalmente observalor alto de r

2 por pura casualidadDada cualquier regresioacuten simple (o muacuteltiple) es natural preguntarse si el valor de r2 (

realmente indica que las variables independientes explican a Y o si esto sucede por cas

A menudo esta interrogante se plantea de la siguiente manera iquestla regresioacuten como un todo ficativa En la uacuteltima seccioacuten vimos coacutemo decidir si una X i individual es una variable exp

Significancia de laregresioacuten comoun todo

FIGURA 13-3

Uso de ldquoprdquo paradeterminar si X i esuna variable expli-cativa significativa

Regioacuten de aceptacioacuten Regioacuten de aceptacioacuten

2 del aacuterea

2 del aacuterea

2 del aacuterea

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

ndasht c

ndasht o

t o

t c

0

(a) p es mayor que X

i no es una variable

explicativa significativa

(b) p es menor que X

i es una variable

explicativa significativa

ndasht o

ndasht c

t c

0

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2356

significativa ahora veremos coacutemo decidir si todas las X i tomadas en conjunto explican significavamente la variabilidad observada de Y Nuestras hipoacutetesis son

H0 B1 ϭ B2 ϭ ϭ Bk ϭ 0 larr Hipoacutetesis nula Y no depende de las X i

H1 por lo menos una Bi 0 larr Hipoacutetesis alternativa Y depende de al menos una de las X i

Cuando analizamos r 2 en el capiacutetulo 12 consideramos la variacioacuten total en Y sum(Y Ϫ Y ෆ )2 la p

te de dicha variacioacuten que explica la regresioacuten sum(Y ˆ Ϫ Y ෆ )2 y la parte no explicada de la variacioacutensum(Y Ϫ Y ˆ )2 La figura 13-4 es un duplicado de la figura 12-15 Sirve como repaso de la relacioacuten etre la desviacioacuten total la desviacioacuten explicada y la desviacioacuten no explicada para un solo dato en uregresioacuten simple Aunque no podamos dibujar una figura similar para una regresioacuten muacuteltiple coceptualmente estamos haciendo lo mismo

Al analizar la variacioacuten en Y fijamos nuestra atencioacuten en tres teacuterminos diferentes cada uno de cuales es una suma de cuadrados Los denotamos con

Suma de cuadradosy sus grados delibertad

Anaacutelisis de lavariacioacuten de losvalores Y

FIGURA 13-4

Desviacioacuten totaldesviacioacutenexplicada ydesviacioacuten noexplicada paraun valor observadode Y

Y

X

Un valor observado de lavariable dependiente (Y )

R e c t a d

e r e g r e s

i oacute n

Desviacioacuten no explicada de esta Y respectoa su media Y

(Y ndash Y )^

Desviacioacuten explicada deesta Y respecto a su media Y

(Y ndash Y )^Y

Valor estimado de esta Y

a partir de la recta de regresioacuten (Y )^

Desviacioacuten total de esta Y

respecto a su media Y

(Y ndash Y )

Tres sumas de cuadrados

SCT ϭ suma de cuadrados total (es decir la parte explicada) ϭ sum(Y Ϫ Y ෆ )2

SCR ϭ suma de cuadrados de la regresioacuten (es decir la parte explicada) ϭ sum(Y ˆ Ϫ Y ෆ )2 [13-10

SCE ϭ suma de cuadrados del error (es decir la parte no explicada) ϭ sum(Y Ϫ Y ˆ )2

Estaacuten relacionadas por la ecuacioacuten

que dice que la variacioacuten total en Y puede dividirse en dos partes la parte explicada y la no explicaCada una de estas sumas de cuadrados tiene un nuacutemero asociado de grados de libertad SCT t

ne n Ϫ 1 grados de libertad (n observaciones menos un grado de libertad debido a que la media la muestra estaacute fija) SCR tiene k grados de libertad porque existen k variables independientes qse utilizaron para explicar Y Finalmente SCE tiene n Ϫ k Ϫ 1 grados de libertad porque utilizamnuestras n observaciones para estimar k ϩ 1 constantes a b1 b2 bk Si la hipoacutetesis nula es ci

ta el cociente

Descomposicioacuten de la variacioacuten total de Y

SCT ϭ SCR ϩ SCE [13-1

Cociente F

F ϭ [13-12SCR k ᎏᎏ

SCE(n ndash k ndash 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2456

tiene una distribucioacuten F con k grados de libertad en el numerador y n Ϫ k Ϫ 1 grados de libel denominador Si la hipoacutetesis nula es falsa entonces el cociente tiende a ser maacutes grande qula hipoacutetesis nula es verdadera De modo que si el cociente F es demasiado grande (seguacuten lo na el nivel de significancia de la prueba y el valor apropiado de la tabla 6 del apeacutendice) rechH0 y concluimos que la regresioacuten como un todo es significativa

La figura 13-5 presenta la salida de Minitab para el problema del IRS Esta parte del rincluye los cocientes F calculados para la regresioacuten en ocasiones llamado anaacutelisis de v

(ANOVA) para la regresioacuten Probablemente se pregunte si esto tiene algo que ver con el anaacutelisrianza que estudiamos en el capiacutetulo 11 La respuesta es siacute Aunque no lo hicimos es posibletrar que el anaacutelisis de varianza visto en el capiacutetulo 11 tambieacuten contempla la variacioacuten total las observaciones alrededor de la gran media y la divide en dos partes una explicada por lascias entre los distintos grupos (que corresponde a lo que llamamos varianza entre columnas)

no explicada por dichas diferencias (que corresponde a la varianza dentro de columnas) Estcisamente anaacutelogo a lo que acabamos de hacer en la ecuacioacuten 13-11Para el problema del IRS vemos que SCR ϭ 29109 (con k ϭ 3 grados de libertad) SCE

(con n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad) y que

F ϭ ϭ ϭ 11833

Los elementos en la columna ldquoMCrdquo son justo las sumas de cuadrados divididas entre sus glibertad Para 3 grados de libertad en el numerador y 6 en el denominador la tabla 6 del apeacutence que 978 es el liacutemite superior de la regioacuten de aceptacioacuten para un nivel de significancia El valor calculado de F 11833 estaacute muy por arriba de 978 de manera que se ve que la r

como un todo es altamente significativa Se puede llegar a la misma conclusioacuten si se observresultado del programa dice que ldquo prdquo es 0000 Debido a que este valor prob es menor que elsignificancia ϭ 001 se concluye que la regresioacuten completa es significativa De esta mapuede usar la p de ANOVA como prueba sin tener que utilizar la tabla 6 del apeacutendice para bvalor criacutetico de F Esto es anaacutelogo a la manera en que se usaron los valores de p en la figura ra probar la significancia de las variables explicativas individuales

Multicolinealidad en la regresioacuten muacuteltiple

En el anaacutelisis de regresioacuten muacuteltiple los coeficientes de regresioacuten a menudo se vuelven

confiables conforme aumenta el grado de correlacioacuten entre las variables independie

existe un alto nivel de correlacioacuten entre algunas de las variables independientes nos enfrenun problema que los estadiacutesticos llaman multicolinealidad

La multicolinealidad puede presentarse si deseamos estimar la recuperacioacuten de las ventaempresa y utilizamos tanto el nuacutemero de vendedores empleados como sus salarios totales Cvalores asociados con estas dos variables independientes tienen una correlacioacuten alta neceusar soacutelo un conjunto de ellos para realizar nuestra estimacioacuten De hecho al agregar una segriable que estaacute correlacionada con la primera se distorsionan los valores de los coeficientgresioacuten Sin embargo a menudo podemos predecir bien Y incluso cuando haya multicoline

Consideremos un ejemplo donde existe multicolinealidad para ver coacutemo afecta a la regresrante los 12 meses pasados el gerente del restaurante Pizza Shack ha estado poniendo unaanuncios en el perioacutedico local Los anuncios se programan y pagan el mes anterior a que ap

Un ejemplo demulticolinealidad

Definicioacuten y efecto dela multicolinealidad

9703ᎏ

0082

29109 3ᎏ

0491 6Prueba de lasignificancia de laregresioacuten en elproblema del Serviciode Contribuciones

Anaacutelisis devarianza parala regresioacuten

Prueba F de laregresioacuten como

un todo

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 29 1088 9 7029 118 52 0Er r or 6 0 4912 0 0819Tot al 9 29 6000

FIGURA 13-5Salida de Minitabanaacutelisis devarianza

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2556

Cada anuncio contiene un cupoacuten que permite llevarse dos pizzas pagando solamente la de mcio El gerente recolectoacute los datos de la tabla 13-4 y le gustariacutea utilizarlos para predecir las vpizzas

En las figuras 13-6 y 13-7 se dieron los resultados de Minitab para las regresiones respelas ventas totales sobre el nuacutemero de anuncios y sobre el costo

Para la regresioacuten sobre el nuacutemero de anuncios tenemos que el valor t observado es 395grados de libertad y un nivel de significancia de ϭ 001 se encontroacute que el valor t criacuteticdo de la tabla 2 del apeacutendice) es 3169 Como t o Ͼ t c (o de manera equivalente como p es m001) concluimos que el nuacutemero de anuncios es una variable explicativa altamente signifilas ventas totales Note tambieacuten que r 2 ϭ 610 de modo que el nuacutemero de anuncios explximadamente el 61 de la variacioacuten en las ventas de pizzas

Para la regresioacuten sobre el costo de los anuncios el valor t observado es 454 de modo qude los anuncios es una variable explicativa de las ventas totales todaviacutea maacutes significativa que ro de anuncios (para los que el valor t observado fue soacutelo 395) En esta regresioacuten r 2 ϭ 673

el costo de los anuncios explica aproximadamente el 67 de la variacioacuten de las ventas de pizComo ambas variables explicativas son altamente significativas por siacute mismas intentam

zar ambas en una regresioacuten muacuteltiple El resultado se presenta en la figura 13-8La regresioacuten muacuteltiple es altamente significativa como un todo ya que la p de ANOVA e

Uso de ambas varia-bles explicativas enuna regresioacuten muacuteltiple

Dos regresionessimples

Datos de ventas y anun-cios para el restaurantePizza Shack

Tabla 13-4 X 1 X 2 Y

Nuacutemero Costo de anuncios Venta tode anuncios publicados de pizz

Mes publicados (cientos de doacutelares) (miles de d

Mayo 12 139 436

Junio 11 120 380

Julio 9 93 301

Agosto 7 97 353

Septiembre 12 123 464

Octubre 8 114 342

Noviembre 6 93 302

Diciembre 13 143 407

Enero 8 102 385

Febrero 6 84 226

Marzo 8 112 376

Abril 10 111 352

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esVENTAS = 16 9 + 2 08 ANUNCI OS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 16 937 4 982 3 40 0 007ANUNCI OS 2 0832 0 5271 3 95 0 003

s = 4 206 R- s q = 61 0

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 1 276 31 276 31 15 62 Er r or 10 176 88 17 69Tot a l 11 453 19

Figura 13-6

Regresioacuten de lasventas sobre elnuacutemero deanuncios conMinitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2656

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2756

gar el nuacutemero de anuncios como segunda variable explicativa ademaacutes del costo de los anuncios eplica nada maacutes alrededor del 1 adicional de la variacioacuten de las ventas totales

En este punto es justo preguntarse iquestqueacute variable realmente explica la variacioacuten de las ventotales en la regresioacuten muacuteltiple La respuesta es que ambas la explican pero no podemos separ

sus contribuciones individuales debido a que estaacuten altamente correlacionadas entre siacute E

consecuencia sus coeficientes en la regresioacuten muacuteltiple tienen errores estaacutendar altos valore

calculados relativamente bajos y valores prob Ͼ | t | relativamente altos

iquestDe queacute manera nos afecta esta multicolinealidad Todaviacutea podemos hacer predicciones relativmente precisas cuando se encuentra presente note que para la regresioacuten muacuteltiple (la salida se dala figura 13-8) el error estaacutendar de la estimacioacuten que determina el ancho de los intervalos de co

fianza para las predicciones es 3989 mientras que para la regresioacuten simple con el costo de los anucios como variable explicativa (salida en la figura 13-7) tenemos se ϭ 3849 Lo que no podemhacer es predecir con mucha precisioacuten coacutemo cambiaraacuten las ventas si aumentamos en uno el nuacutemede anuncios La regresioacuten muacuteltiple dice que b1 ϭ 0625 (esto es cada anuncio aumenta las ventotales de pizzas alrededor de $625) pero el error estaacutendar de este coeficiente es 112 (es decir apximadamente $1120)

Las contribucionesindividuales nopueden separarse

Ejercicios 134

Ejercicios de autoevaluacioacuten

EA 13-4 Edith Pratt es una ocupada ejecutiva de una compantildeiacutea de transporte de carga a nivel nacional y va tara una junta porque no encuentra la salida de la regresioacuten muacuteltiple elaborada por un asistente Si la regsioacuten total es significativa al nivel 005 ella desea usar las salida de computadora como evidencia para fudamentar algunas ideas que expondraacute en la reunioacuten Sin embargo su ayudante estaacute enfermo De hectoda la informacioacuten que tiene de la regresioacuten muacuteltiple es un trozo de papel con los siguientes datos

Regresioacuten paraEdith Pratt

SCR 8724 con gl

SCE con 17 gl

SCT 10236 con 24 gl

Como el papel ni siquiera tiene todos los nuacutemeros Edith ha concluido que no es uacutetil Usted sin embardebe saber maacutes que ella iquestPuede Edith entrar en la junta o debe seguir buscando la salida de computador

EA 13-5 Una pequentildea liacutenea aeacuterea de Nueva Inglaterra realizoacute una encuesta sobre sus 15 terminales y obtuvo losguientes datos para el mes de febrero donde

VENTAS ϭ ingreso total seguacuten el nuacutemero de boletos vendidos (en miles de doacutelares)

PROMOCϭ cantidad gastada en promociones de la liacutenea aeacuterea en el aacuterea (en miles de doacutelares)

COMPET ϭ nuacutemero de liacuteneas aeacutereas que compiten en esa terminal

GRATIS ϭ nuacutemero de pasajeros que vuelan gratis (por diferentes razones)

Sugerencia el concepto de hacer infe-rencias respecto a una regresioacuten muacutelti-ple es justo lo mismo que se hizo en elcapiacutetulo 12 cuando hicimos inferencias

respecto a una recta de regresioacuten excepto que ahora se em-

plean dos o maacutes variables independientes Advertencia lamulticolinealidad es un problema que debe manejarse enla regresioacuten muacuteltiple y es necesario desarrollar una com-prensioacuten con sentido comuacuten Recuerde que todaviacutea puedehacer predicciones precisas cuando estaacute presente Pero re-cuerde tambieacuten que no puede decir con mucha precisioacuten

cuaacutento cambiaraacute la variable dependiente si ldquomanipulardquo lavariables independientes Entonces el objetivo debe seminimizar la multicolinealidad Sugerencia la mejor regresioacuten muacuteltiple es la que explica la relacioacuten entre los datos asentildealar la responsabilidad de la mayor proporcioacuten de la va

riacioacuten en la variable dependiente con el menor nuacutemero dvariables independientes Advertencia no es una buenidea incluir demasiadas variables independientes soacutelo porque cuenta con una computadora y un paquete de softwarpara estadiacutestica

SUGERENCIAS

Y

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2856

Ventas (doacutelares) Promoc (doacutelares) Compet Gratis

793 25 10 3

2001 55 8 6

1632 60 12 9

2001 79 7 16

1460 52 8 15

1777 76 12 9

309 20 12 8

2919 90 5 10

1600 40 8 43394 96 5 16

1596 55 11 7

863 30 12 6

2375 60 6 10

1072 50 10 4

1550 35 10 4

a) Utilice la siguiente salida de Minitab para determinar la ecuacioacuten de regresioacuten que mejor se ara la liacutenea aeacuterea

La ec uaci oacuten de r egr es i oacuten esVENTAS ϭ 172 ϩ 25 9 PROMOVϪ 13 2 COMPET Ϫ 3 04 GRATI S

Pr onos t i cador Coef Des vEs t Coci ent e - t Cons t ant e 172 34 51 38 3 35 0PROMOV 25 950 4 877 5 32 0COMPET - 13 238 3 686 - 3 59 0GRATI S - 3 041 2 342 - 1 30 0

b) iquestLos pasajeros que vuelan gratis ocasionan una disminucioacuten significativa en las ventas Fpruebe las hipoacutetesis apropiadas Use ϭ 005

c) iquestUn incremento de $1000 en las promociones cambia las ventas en $28000 o el cambio ecativamente diferente de $28000 Formule y pruebe las hipoacutetesis adecuadas Use ϭ 010

d) Calcule un intervalo de confianza del 90 para el coeficiente de la pendiente de la COMPET

Aplicaciones

13-22 Mark Lowtown publica el perioacutedico Mosquito Junction Enquirer y tiene problemas para predectidad de papel perioacutedico que necesita imprimir diariamente Eligioacute aleatoriamente 27 diacuteas del arior y registroacute la siguiente informacioacuten

PESO ϭ peso en libras de papel perioacutedico para la edicioacuten de ese diacutea

CLASIFICADOS ϭ nuacutemero de anuncios clasificados

PUBLICIDAD ϭ nuacutemero de anuncios publicitarios

PLANA COMPLETA ϭ nuacutemero de anuncios a una plana

Utilizando Minitab para hacer una regresioacuten de PESO sobre las otras tres variables Mark obtuguiente salida

Pr onos t i cador Coef Des vEs t Coci ent e- t Cons t ant e 1072 95 872 43 1 23 0CLASI FI CADOS 0 251 0 126 1 99 0PUBLI CI DAD 1 250 0 884 1 41 0PLANA COMPLETA 250 66 67 92 3 69 0

a) Mark siempre ha pensado que cada anuncio publicitario utiliza al menos 3 libras de papel iquestsioacuten le da una razoacuten significativa para dudar esto al nivel del 5

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2956

b) De manera similar Mark siempre ha creiacutedo que cada anuncio clasificado utiliza aproximmedia libra de papel iquestTiene ahora Mark una razoacuten significativa para dudar esto al nivel del

c) Mark vende espacios de anuncios de plana completa a los comerciantes locales a $30 la paacutegberaacute pensar en ajustar sus tarifas si el papel perioacutedico le cuesta $009 por libra Suponga costos son despreciables Establezca expliacutecitamente las hipoacutetesis y una conclusioacuten (Sugere

jando todo lo demaacutes constante cada anuncio adicional de plana completa tiene un costo de bras de papel ϫ $009 por libra ϭ $2256 El punto de equilibrio es 333333 libras iquestPor quel coeficiente de pendiente para PLANA COMPLETA es significativamente mayor que Mark no estaacute obteniendo ganancias y debe cambiar sus tarifas)

13-23 Para los datos del ejercicio 13-18 y un nivel de significancia de 010 iquestcuaacuteles variables son sign

mente explicativas de los resultados de los exaacutemenes (Habiacutea 12 estudiantes en la muestra) 13-24 Para los datos del ejercicio 13-18 y la siguiente salida de Minitab del procedimiento de regresiple hecho por Bill

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 3134 42 783 60Er r or 7 951 25 135 89Tot a l 11 4085 67

a) iquestCuaacutel es el valor observado de F b) A un nivel de significancia de 005 iquestcuaacutel es el valor criacutetico de F que se debe utilizar para d

si la regresioacuten como un todo es significativac) Basaacutendose en las respuestas a los incisos a) y b) iquestes la regresioacuten significativa como un tod

13-25 Remiacutetase al ejercicio 13-19 A un nivel de significancia de 001 iquestes la variable DISTANCIA uble explicativa significativa para VENTAS

13-26 Para los datos del ejercicio 13-19 y la siguiente salida adicional de Minitab al correr la regresioacuten

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 2861495 715374 102 39 0Er r or 18 125761 6896 7Tot a l 22 2987256

Al nivel de significancia de 005 iquestes la regresioacuten significativa como un todo

13-27 Henry Lander es el director de produccioacuten de la Alecos Corporation de Caracas Venezuela Hede que le ayude a determinar una foacutermula para predecir el ausentismo de los empacadores de chipoacutetesis es que la temperatura diaria promedio puede explicar el porcentaje de ausentismo Durios meses reuacutene datos ejecuta el procedimiento de regresioacuten simple y encuentra que la tempeplica 66 de la variacioacuten en el ausentismo Pero Henry no estaacute convencido de que eacuteste sea un cador satisfactorio Sugiere que la precipitacioacuten pluvial diaria podriacutea tambieacuten tener algo que vausentismo de modo que registra los datos correspondientes y hace una regresioacuten del ausentismte el tiempo de lluvias y obtiene un valor R2 de 059 ldquoiexclEurekardquo grita usted ldquoiexclLo tengo Con uticador que explica 66 y otro que explica 59 todo lo que tengo que hacer es una regresioacutenutilizando ambos y seguramente tendreacute un pronosticador casi perfectordquo Para su desaacutenimo sin la regresioacuten muacuteltiple tiene una R

2 de soacutelo 68 que es solamente un poco mejor que la variablperatura sola iquestCoacutemo puede explicar esta aparente discrepancia

13-28 Juan Armenlegg administrador de Rockyrsquos Diamond y Jewelry Store estaacute interesado en desamodelo para estimar la demanda del consumidor para su costosa mercanciacutea Como la mayoriacutea de

tes compran diamantes y joyas a creacutedito Juan estaacute seguro de que dos factores que deben influirmanda de los clientes son la tasa real de inflacioacuten anual y la tasa real de intereses sobre preacutestamprincipales bancos del paiacutes Explique algunos problemas que Juan podriacutea encontrar si fuera a dun modelo de regresioacuten basado en estas dos variables de prediccioacuten

13-29 Un nuevo programa de juegos Check That Model pide a los concursantes que especifiquen el nuacutenimo de paraacutemetros que necesitan para determinar si un modelo de regresioacuten muacuteltiple es signifimo un todo para ϭ 001 Usted ganoacute la apuesta con 4 paraacutemetros Use la siguiente informacioacutenterminar si la regresioacuten es significativa

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3056

R 2

ϭ 07452

SCE ϭ 1254

n ϭ 18

Nuacutemero de variables independientes ϭ 3

13-30 La Scottish Turist Agency estaacute interesada en el nuacutemero de turistas que entran al paiacutes cada semanrante la temporada alta Se recolectaron los siguientes datos

Turistas (Y ) ϭ nuacutemero de turistas que entran a Escocia en una semana (en miles)

Cambio (X 1)ϭ nuacutemero de libras escocesas compradas por $1 doacutelar

Precio (X 2) ϭ nuacutemero de libras escocesas cobradas por viaje redondo en camioacuten de Londres a Edimburgo

Promoc (X 3) ϭ cantidad gastada en promocioacuten del paiacutes (en miles de libras escocesas)Temp (X 4) ϭ temperatura media durante la semana en Edimburgo (en grados Celsius)

Turistas (Y ) Cambio (X 1) Precio (X 2) Promoc (X 3) Temp (X 4)

69 061 40 87 154

71 059 40 88 156

68 063 40 85 154

79 061 35 86 153

76 060 35 94 158

82 065 35 99 162

80 058 35 98 164

84 059 35 102 166

97 061 30 114 174

98 062 30 116 172

72 057 40 84 176

67 055 40 86 164

a) Utilice el paquete de software que tenga para determinar la ecuacioacuten de regresioacuten que mejote a los datos de la agencia de turismo

b) iquestEs la tasa de cambio una variable explicativa significativa Establezca y pruebe las hipoacutetesidas a un nivel de significancia de 010

c) Un incremento de 1000 libras en las promociones iquestaumenta el nuacutemero de turistas en maacutesEstablezca y pruebe las hipoacutetesis adecuadas para un nivel de significancia de 005

d) Calcule un intervalo de confianza del 95 para el coeficiente de la pendiente de Temp

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-4 Como SCT ϭ SCR ϩ SCE SCE ϭ SCT Ϫ SCR ϭ 10236 Ϫ 8724 ϭ 1512Como gl SCT ϭ gl SCR ϩ gl SCE gl SCR ϭ gl SCT Ϫ gl SCE ϭ 24 Ϫ 17 ϭ 7

Entonces F ϭ ϭ ϭ 1401

F CRiacuteT ϭ F (7 17 005) ϭ 261Como F OBS gt F CRIacuteT se concluye que la regresioacuten es significativa como un todo Edith debe conticando la salida de computadora de la regresioacuten para usarla en la junta

EA 13-5 De la salida de computadora se obti enen los siguientes resultadosa) VENTAS ϭ 17234 ϩ 25950PROMOC Ϫ13238COMPET Ϫ 3041GRATISb) H0 BGRATIS ϭ 0 H1 BGRATIS Ͻ 0 ϭ 005

Eacutesta es una prueba de una cola y el valor prob en los resultados es para la alternativa de dos c BGRATIS 0 De manera que para esta prueba el valor prob es 02212 ϭ 0111 Ͼ ϭ 00que no se puede rechazar H0 las ventas no disminuyen significativamente cuando aumenta ro de pasajeros que vuelan gratis

c) H0 BPROMOC ϭ 28 H1 BPROMOC 28 ϭ 010

87247ᎏᎏ

151217SCRk ᎏᎏ

SCE(n Ϫ k Ϫ 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3156

El valor observado t de los resultados de regresioacuten es

ϭ ϭ Ϫ0420

Con 11 grados de libertad y ϭ 010 en ambas colas combinadas los valores criacuteticos t parba son Ϯ1796 asiacute el valor observado estaacute dentro de la regioacuten de aceptacioacuten No se rechacambio en VENTAS para un incremento de una unidad ($1000) en PROMOC no es significate diferente de 28 ($28000)

d) Con 11 grados de libertad el valor t para un intervalo del 90 de confianza es 1796 por lo

tervalo esbCOMP Ϯ 1796sbCOMP

ϭ Ϫ13238 Ϯ 1796(3686)

ϭ Ϫ13238 Ϯ 6620 ϭ (Ϫ19858 Ϫ 6618)

La liacutenea aeacuterea puede tener una seguridad del 90 de que el ingreso por los boletos en una ofminuye entre $6600 y $19900 aproximadamente con cada liacutenea aeacuterea adicional que comp

135 Teacutecnicas de modelado

Dada una variable que deseamos explicar y un conjunto de variables explicativas potencialehaya varias ecuaciones de regresioacuten diferentes que podamos estudiar dependiendo de queacute explicativas incluyamos y de coacutemo lo hagamos Cada una de esas ecuaciones de regresioacutence como modelo Las teacutecnicas de modelado son las distintas formas en que podemos incluriables explicativas y verificar queacute tan apropiados son los modelos de regresioacuten Existen municas de modelado diferentes pero soacutelo veremos dos de las maacutes utilizadas

Datos cualitativos y variables ficticias

En todos los ejemplos de regresioacuten que hemos visto hasta ahora los datos manejados hanmeacutericos o cuantitativos Pero ocasionalmente nos enfrentaremos con una variable categoacuterilitativa En el problema del inicio el capiacutetulo el director de personal desea ver si el salarioun vendedor depende de su sexo En la tabla 13-5 repetimos los datos de dicho problema

Por el momento ignore la antiguumledad y utilice la teacutecnica desarrollada en el capiacutetulo 9 bar la diferencia entre las medias de dos poblaciones para ver si los hombres ganan maacutes qu

jeres Pruebe con ϭ 001 Si tomamos a los hombres como la poblacioacuten 1 y a las mujerespoblacioacuten 2 probaremos las siguientes hipoacutetesis

H0 1 ϭ 2 larr Hipoacutetesis nula no existe discriminacioacuten por sexo en los salarios base

H1 1 Ͼ 2 larr Hipoacutetesis alternativa se discrimina a las mujeres en su salario base

ϭ 001 larr Nivel de significancia

Revisioacuten del enfoqueanterior del problema

Buacutesqueda dediferentes modelos

25950 Ϫ 28ᎏᎏ

4877

(bPROMOC Ϫ 28)ᎏᎏ

sbPROMOC

Datos para el problemade discriminacioacuten porsexo

Tabla 13-5 Vendedores VendedorasAntiguumledad Salario base Antiguumledad Salario base(en meses) (en miles) (en meses) (en miles)

6 75 5 62

10 86 13 87

12 91 15 94

18 103 21 98

30 130

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3256

A continuacioacuten bosquejamos el anaacutelisis Si tiene problemas para seguirlo deberaacute repasamente la seccioacuten 93

n1 ϭ 5 n2 ϭ 4

x ෆ1 ϭ 97 x ෆ2 ϭ 8525

s2

1 ϭ 4415 s2

2 ϭ 2609

s2

p ϭ

ϭ

ϭ 3641

x ෆ1Ϫ x

ෆ2ϭ s pΊ ϩ

ϭ 128

t ϭ

ϭ

ϭ 092

Con siete grados de libertad el valor t criacutetico para una prueba de cola superior con ϭ 001 eComo el valor t observado de 092 es menor que 2998 no podemos rechazar H0

Entonces el anaacutelisis concluye que no parece haber discriminacioacuten por sexo en los salarPero recuerde que hasta ahora se han ignorado los datos de antiguumledad laboral para el anaacuteli

Antes de seguir vea el diagrama de dispersioacuten de los datos En la figura 13-9 los punto

corresponden a los hombres y los blancos a las mujeres El diagrama de dispersioacuten muestraridad que el salario base aumenta con los antildeos de antiguumledad pero si con la mirada sigue lo qla recta de regresioacuten notaraacute que los puntos negros tienden a estar arriba de ella y los blancos

La figura 13-10 da la salida de una regresioacuten del salario base sobre los meses de antiguumlelos resultados se ve que la antiguumledad es una variable explicativa altamente significativa

Ademaacutes r 2

ϭ 926 que indica que la variable meses de antiguumledad explica cerca del 9variacioacuten en el salario base La figura 13-11 contiene parte de la salida que no se vio antesbla de residuos Para cada punto el residuo es simplemente Y Ϫ Y ˆ que se reconoce como el

Una ldquomiradardquo a los

datos

El enfoque anterior nodetecta discriminacioacuten

(97 ndash 8525) ndash 0ᎏᎏ

128

( x ෆ1 ndash x ෆ2) ndash (1 Ϫ 2)H0

ᎏᎏᎏ

ˆ x ෆ1Ϫ

x ෆ2

1ᎏ

n2

1ᎏ

n1

4(4415) ϩ 3(2609)ᎏᎏᎏ5 ϩ 4 ndash 2

(n1 ndash 1)s21 ϩ (n2 ndash 1)s22ᎏᎏᎏ

n1 ϩ n2 ndash 2

FIGURA 13-9

Diagrama de dis-persioacuten de salariosbase contra mesesde antiguumledad

4 8 12 16 20 24 28

4

8

12

Meses de antiguumledad

S a l a r i o ( m i l e s d e d oacute l a r e s )

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3356

el ajuste de la recta de regresioacuten en ese punto En la figura 13-11 AJUST1 son los valores y RESI1 son los residuos

Tal vez la parte maacutes importante del anaacutelisis del resultado de una regresioacuten sea estusiduos Si la regresioacuten incluye todos los factores explicativos relevantes estos residuo

ser aleatorios Dicho de otro modo si los residuos muestran cualquier patroacuten no aleat

to indica que hay algo sistemaacutetico que afecta el proceso y que no hemos tomado en cu

manera que buscamos patrones en los residuos o para decirlo de forma maacutes pintoresca ldquopmos a los residuos hasta hacerlos hablarrdquo

Si observamos los residuos presentados en la figura 13-11 vemos que los primeros cincoson positivos De modo que para los vendedores tenemos Y ndash Y ˆ Ͼ 0 o Y Ͼ Y ˆ es decir laregresioacuten cae abajo de estos cinco puntos Tres de los cuatro uacuteltimos residuos son negaticonsiguiente para las vendedoras tenemos Y Ϫ Y ˆ Ͻ 0 o Y Ͻ Y ˆ asiacute que la recta de regresicuentra arriba de tres de los cuatro puntos Esto confirma lo que vimos al observar el diagdispersioacuten de la figura 13-9 Este patroacuten no aleatorio en los residuos sugiere que el sexo siacute etor determinante del salario base

iquestCoacutemo podemos incorporar el sexo de los vendedores dentro del modelo de regresioacutencemos utilizando un dispositivo llamado variable ficticia (o variable indicadora) Para lpuntos que representan a los vendedores esta variable tiene valor de 0 y para los cuatro purepresentan a las vendedoras valdraacute 1 Los datos de entrada para nuestra regresioacuten con variticias se dan en la tabla 13-6

Para los datos de la tabla 13-6 se ajusta una regresioacuten de la forma

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

Uso de variablesficticias

Deteccioacuten depatrones en losresiduos

ldquoPresionar a losresiduosrdquo

Anaacutel i s i s de r e gr e s i oacuten

La ec uac i oacuten de r e gr es i oacuten esSALARI O ϭ 5 81 ϩ 0 233 MESES

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t pCons t a nt e 5 8093 0 4038 14 39 0 000MESES 0 23320 0 02492 9 36 0 000

s ϭ 0 5494 R- s q ϭ 92 6

Anaacute l i s i s de va r i a nz aFUENTE GL SC MC F Re gr e s i oacuten 1 26 443 24 443 87 61 0Er r or 7 2 113 0 302Tot a l 8 28 556

FIGURA 13-10

Regresioacuten conMinitab del salariobase sobre losmeses deantiguumledad

RENGLOacuteN SALARI O AJ UST1 RESI 1

1 7 5 7 2085 0 2914992 8 6 8 1413 0 458684

3 9 1 8 6077 0 4922764 10 3 10 0069 0 2930545 13 0 12 8054 0 1946076 6 2 6 9753 - 0 7752977 8 7 8 8409 - 0 1409288 9 4 9 3073 0 0926649 9 8 10 7066 - 0 906558

FIGURA 13-11

Tabla de residuosde Minitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1656

Se recolectaron datos correspondientes al periodo 1982-1996

Antildeo Demanda Precio ($) Ingreso ($) Sub ($)

1982 40 9 400 101983 45 8 500 141984 50 9 600 121985 55 8 700 131986 60 7 800 111987 70 6 900 151988 65 6 1000 161989 65 8 1100 17

1990 75 5 1200 221991 75 5 1300 191992 80 5 1400 201993 100 3 1500 231994 90 4 1600 181995 95 3 1700 241996 85 4 1800 21

a) Utilice el paquete de software que tenga disponible para encontrar la ecuacioacuten de regresioacuten ajuste para estos datos

b) iquestSon los signos (ϩ o Ϫ) de los coeficientes de regresioacuten de las variables independientes los qperan Deacute una explicacioacuten breve ( Nota Eacutesta no es una pregunta estadiacutestica soacutelo necesita pesignifican los coeficientes de regresioacuten)

c) Establezca e interprete el coeficiente de determinacioacuten muacuteltiple del problemad) Establezca e interprete el error estaacutendar de la estimacioacuten para el problemae) Seguacuten la ecuacioacuten de regresioacuten obtenida iquestqueacute valor de DEMAND predeciriacutea si el precio de

ductos fue $6 el ingreso del consumidor $1200 y el precio del bien sustituto $17 13-18 Bill Buxton profesor de estadiacutestica de una prominente escuela de administracioacuten tiene un prof

tereacutes en los factores que afectan el desempentildeo de los estudiantes en los exaacutemenes El examen psemestre anterior tuvo una distribucioacuten de calificaciones amplia pero Bill tiene la certeza de qfactores explican esa distribucioacuten permite a sus estudiantes que estudien en tantos libros comoca el coeficiente de inteligencia de los estudiantes variacutea tienen distintas edades y difieren losque dedican a estudiar Con el propoacutesito de desarrollar una foacutermula de prediccioacuten para las califde los exaacutemenes Bill pidioacute a cada estudiante que respondiera al final del examen preguntas refe

tiempo de estudio y nuacutemero de libros utilizados Los registros que teniacutea Bill ya incluiacutean el coefiinteligencia y la edad de modo que reunioacute los datos del grupo y corrioacute la regresioacuten muacuteltiple deLa salida de la corrida de Bill fue la siguiente

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t Con s t a nt e minus49 948 41 55 minus1 20 0HORAS 1 06931 0 98163 1 09 0CI 1 36460 0 37627 3 63 0LI BROS 2 03982 1 50799 1 35 0EDAD minus1 79890 0 67332 minus2 67 0

s = 11 657 R- s q = 76 7

a) iquestCuaacutel es la ecuacioacuten de regresioacuten de mejor ajuste para estos datos

b) iquestQueacute porcentaje de la variacioacuten en las calificaciones se explica con esta ecuacioacutenc) iquestQueacute calificacioacuten esperariacutea usted para un estudiante de 21 antildeos de edad con un coeficiente gencia (CI) de 113 que estudioacute durante cinco horas y utilizoacute tres libros diferentes

13-19 La compantildeiacutea de tiendas de abarrotes Twenty-Two estaacute planeando expandir su cadena Como ayudleccionar los lugares donde abriraacute las nuevas tiendas recolectoacute datos de las ventas semanales de casus 23 tiendas Para explicar la variabilidad de las ventas semanales tambieacuten reunioacute informacioacutencribe cuatro variables que se cree estaacuten relacionadas con las ventas Las variables se definen como

VENTAS ϭ ventas semanales promedio en cada tienda en miles de doacutelares

AUTOS ϭ volumen promedio de traacutensito de automoacuteviles por semana en miles de autos

ENTRADA ϭ facilidad de entradasalida medida en una escala de 1 a 100

INGANUAL ϭ ingreso anual promedio por familia en el aacuterea en miles de doacutelares

DISTANCIA ϭ distancia en millas desde la tienda al supermercado maacutes cercano

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1756

Los datos se analizaron con Minitab y la salida es la siguiente

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t Cons t a nt e 175 37 92 62 1 89 0 0AUTOS - 0 028 0 315 minus0 09 0 9ENTRADA 3 775 1 272 2 97 0 0I NGANUAL 1 990 4 510 0 44 0 6DI STANCI A 212 41 28 090 7 56 0 0

s = 85 587 R- s q = 95 8

a) iquestCuaacutel es la ecuacioacuten de regresioacuten de mejor ajuste dada por Minitab

b) iquestCuaacutel es el error estaacutendar de la estimacioacuten para esta ecuacioacutenc) iquestQueacute fraccioacuten de la variacioacuten en las ventas se explica con esta regresioacutend) iquestQueacute ventas predeciriacutea para una tienda localizada en un vecindario que tuvo un ingreso anu

milia de $20000 estaba a 2 millas del supermercado maacutes cercano se encontraba en una calvolumen promedio semanal de traacutensito de 100000 autos y con una facilidad de entrada de

13-20 Rick Blackburn estaacute pensando en vender su casa Con el fin de decidir el precio que pediraacute poreunido datos de 12 ventas recientes Registroacute el precio de venta (en miles de doacutelares) el nuacutemercuadrados de construccioacuten (en cientos de pies cuadrados) el nuacutemero de pisos el nuacutemero de bantiguumledad de la casa (en antildeos)

Precio de venta Pies cuad Pisos Bantildeos Antiguumledad

4965 89 1 10 2

6795 95 1 10 68115 126 2 15 11

8160 129 2 15 8

9150 190 2 10 22

9525 176 1 10 17

10035 200 2 15 12

10425 206 2 15 11

11265 205 1 20 9

14970 251 2 20 8

16065 227 2 20 18

23250 408 3 40 12

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de

de mejor ajuste para los datosb) iquestCuaacutel es el valor de R2 para esta ecuacioacutenc) Si la casa de Rick tiene 1800 pies cuadrados (ϭ 180 cientos de pies cuadrados) un piso

y seis antildeos de antiguumledad iquestqueacute precio de venta puede esperar Rick 13-21 La Allegheny Steel Corporation ha estado buscando los factores que influyen en la cantidad de

millones de toneladas) que puede vender cada antildeo La administracioacuten sospecha que los siguientfactores principales la tasa anual de inflacioacuten del paiacutes el precio promedio por tonelada del acetado que acota los precios (en doacutelares) de Allegheny y el nuacutemero de automoacuteviles (en millonesfabricantes de autos de Estados Unidos planean producir ese antildeo Se recolectaron los datos de losiete antildeos

Y X 2 X 3

Millones X 1 Cota de Nuacutemero

de tons Tasa de importa- deAntildeo vendidas inflacioacuten ciones automoacuteviles

1993 42 31 310 62

1992 31 39 500 51

1991 40 75 220 57

1990 47 107 450 71

1989 43 155 435 65

1988 37 130 260 61

1987 35 110 305 59

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1856

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de regresioacutende mejor ajuste para los datos

b) iquestQueacute porcentaje de la variacioacuten total de la cantidad de acero vendido (en millones de toneladas) porAllegheny cada antildeo explica esta ecuacioacuten

c) iquestCuaacutentas toneladas de acero deberaacute esperar Allegheny vender en un antildeo en el que la tasa de inflacioacutenes 71 los fabricantes de automoacuteviles norteamericanos planean producir 60 millones de autos y la co-ta promedio del acero importado por tonelada es $350

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-3 De la salida del paquete de software se obtienen los siguientes resultadosa) Y ˆ ϭ Ϫ1275 ϩ 17059 X 1 ϩ 05406 X 2 Ϫ 01743 X 3b) R

2ϭ 872 el modelo explica el 872 de la variacioacuten total en Y

c) Y ˆ ϭ Ϫ1275 ϩ 17059(169) ϩ 05406(10212) Ϫ 01743(26925) ϭ 2436 reembolsos de impuestos

134 Inferencias sobre paraacutemetrosde poblacioacuten

En el capiacutetulo 12 se vio que la recta de regresioacuten de la muestra Y ˆ ϭ a ϩ bX (ecuacioacuten 12-3) esti-maba la recta de regresioacuten de la poblacioacuten Y ϭ A ϩ BX (ecuacioacuten 12-13) La razoacuten por la cual soacute-lo podiacuteamos estimar la recta de regresioacuten de poblacioacuten y no determinarla con exactitud era que los

puntos no caen exactamente en la recta de regresioacuten de la poblacioacuten Debido a las variaciones alea-torias los puntos satisfaciacutean Y ϭ A ϩ BX ϩ e (ecuacioacuten 12-13a) maacutes que a Y ϭ A ϩ BX

En la regresioacuten muacuteltiple se tiene justo la misma situacioacuten Nuestro plano de regresioacuten estimado

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k [13-5]

es una estimacioacuten de un plano de regresioacuten de poblacioacuten verdadero pero desconocido de la forma

Plano de regresioacutende la poblacioacuten

De nuevo los puntos individuales normalmente no caen con exactitud en el plano de regresioacuten depoblacioacuten Consideremos el problema del Servicio Interno de Contribuciones para ver por queacute Notodos los pagos a informantes tendraacuten la misma efectividad Algunas horas en computadora podriacuteanutilizarse para recolectar y organizar datos otras para analizar esos datos en busca de errores y frau-des El eacutexito de la computadora en descubrir impuestos no pagados puede depender de cuaacutento tiempose dedique a cada una de estas actividades Por eacutestas y otras razones algunos de los puntos se en-contraraacuten arriba del plano de regresioacuten y algunos estaraacuten abajo de eacuteste En lugar de satisfacer laecuacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

los puntos individuales satisfaraacuten la ecuacioacuten

Las variaciones alea-torias desplazan lospuntos del plano deregresioacuten

Ecuacioacuten de regresioacuten de la poblacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

Plano de regresioacuten de la poblacioacuten maacutes la variacioacuten aleatoria

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e [13-7a]

La cantidad e que aparece en la ecuacioacuten 13-7a es una variacioacuten aleatoria que en promedio es iguala cero La desviacioacuten estaacutendar de las variaciones individuales e y el error estaacutendar de la estima-cioacuten se que estudiamos en la seccioacuten anterior es una estimacioacuten de e

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1956

Como nuestro plano de regresioacuten de la muestra Y ˆ ϭ a ϩ b1X1 ϩ b2 X 2 ϩ ϩ bk X k (ecuaci13-7) estima el plano de regresioacuten de poblacioacuten desconocido Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk

(ecuacioacuten 13-7) deberemos ser capaces de usarlo para hacer inferencias sobre el plano de regreside la poblacioacuten En esta seccioacuten haremos inferencias acerca de las pendientes ( B1 B2 Bk ) deecuacioacuten de regresioacuten ldquoverdaderardquo (la que se aplica a la poblacioacuten completa) basadas en las pendietes (b1 b2 bk ) de la ecuacioacuten de regresioacuten estimada a partir de la muestra de datos

Inferencias acerca de una pendiente individual B i El plano de regresioacuten se deriva de una muestra y no de la poblacioacuten completa Como resultado

podemos esperar que la ecuacioacuten de regresioacuten verdadera Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k que se aplica a la poblacioacuten completa) sea exactamente igual que la ecuacioacuten estimada a partir observaciones de la muestra Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k Sin embargo podemos utilizarvalor de bi una de las pendientes que calculamos a partir de la muestra para probar hipoacutetesis acca del valor de Bi una de las pendientes del plano de regresioacuten para la poblacioacuten completa

El procedimiento para probar una hipoacutetesis respecto a Bi es parecido al procedimiento analizaen los capiacutetulos 8 y 9 sobre pruebas de hipoacutetesis Para entender este proceso regresemos al probma que relaciona los impuestos no pagados descubiertos con las horas de trabajo en auditoriacuteas campo horas en computadora y recompensas a informantes En la paacutegina 729 sentildealamos que b10597 El primer paso consiste en encontrar un valor para B1 y compararlo con b1 ϭ 0597

Suponga que durante un periodo largo la pendiente de la relacioacuten entre Y y X 1 fue 0400 Paprobar si todaviacutea es vaacutelida podriacuteamos definir las hipoacutetesis como

H0 B1 ϭ 0400 larr Hipoacutetesis nula

H1 B1 0400 larr Hipoacutetesis alternativa

De hecho realizamos la prueba para saber si los datos actuales indican que B1 ha cambiado su vahistoacuterico de 0400

Para encontrar el estadiacutestico de prueba para B1 es necesario hallar primero el error estaacutendar d

coeficiente de regresioacuten El coeficiente de regresioacuten con el que estamos trabajando es b1 de moque el error estaacutendar de este coeficiente se representa con sb1

Resulta demasiado difiacutecil calcular sb1 a mano pero por fortuna Minitab calcula los errores estaacutedar de todos los coeficientes de regresioacuten Por comodidad repetimos la figura 13-2 Los errores taacutendar de los coeficientes se dan en la columna DesvEst de la salida de Minitab

En el cuadro de salida vemos que sb1

es 00811 (Similarmente si deseamos probar una hipoacutesis acerca de B2 vemos que el error estaacutendar apropiado que debemos utilizar es sb2 ϭ 00841) Uvez que encontramos sb1 en la salida de Minitab podemos usar la ecuacioacuten 13-8 para estandarizarpendiente de nuestra ecuacioacuten de regresioacuten ajustada

Estandarizacioacutendel coeficiente deregresioacuten

Error estaacutendar delcoeficientede regresioacuten

Prueba de unahipoacutetesis acerca de B i

Diferencia entre la

ecuacioacuten de regre-sioacuten verdadera y unaestimada a partir delas observacionesde la muestra

Coeficiente de regresioacuten estandarizado

t ϭ [13-8bi ndash Bi0ᎏ

sbi

donde

bull biϭ pendiente de la regresioacuten ajustada

bull Bi0 ϭ pendiente real hipoteacutetica para la poblacioacutenbull sbi ϭ error estaacutendar del coeficiente de regresioacuten

iquestPor queacute utilizamos t para denotar el estadiacutestico estandarizado Recuerde que en la regresioacuten siple utilizamos a y b en la ecuacioacuten 12-7 para calcular se y que se estimaba e la desviacioacuten estaacutedar de las variaciones de los datos (ecuacioacuten 12-13a) Entonces utilizamos se en la ecuacioacuten 12-para encontrar sb el error estaacutendar del coeficiente de regresioacuten que corresponde a la pendiente E

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2056

pezamos con n puntos y los usamos para estimar los dos coeficientes a y b Luego basamtras pruebas en la distribucioacuten t con n Ϫ 2 grados de libertad

De manera similar en la regresioacuten muacuteltiple tambieacuten empezamos con n puntos pero lospara estimar k ϩ 1 coeficientes la ordenada a y k pendientes b1 b2 bk Despueacutes estcientes se usan en la ecuacioacuten 13-6 para calcular se que de nuevo es una estimacioacuten de eviacioacuten estaacutendar de las variaciones de los datos (ecuacioacuten 13-7a) Luego se utiliza se (en ucioacuten que estaacute maacutes allaacute del alcance de este libro) para encontrar s

bi Debido a lo anterior

nuestras pruebas de hipoacutetesis en la distribucioacuten t con n Ϫ k Ϫ 1 (ϭ n Ϫ ( k ϩ l)) grados de En nuestro ejemplo el valor estandarizado del coeficiente de regresioacuten es

t ϭ

ϭ

ϭ 2432 larr Coeficiente de regresioacuten estandarizado

Suponga que estamos interesados en probar nuestras hipoacutetesis al nivel de significancia

Como tenemos 10 observaciones en la muestra y tres variables independientes sabemos n Ϫ k Ϫ 1 o 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad Buscamos en la tabla 2 del apeacutendice en lana de 10 y el rengloacuten de 6 grados de libertad Ahiacute vemos que el valor apropiado de t es 19mo nos preocupa si b1 (la pendiente del plano de regresioacuten de la muestra) es significativamferente de B1 (la pendiente hipoteacutetica del plano de regresioacuten de la poblacioacuten) eacutesta es una pdos colas y los valores criacuteticos son Ϯ1943 El coeficiente de regresioacuten estandarizado es 2se encuentra fuera de la regioacuten de aceptacioacuten de nuestra prueba de hipoacutetesis Por consiguichazamos la hipoacutetesis nula de que B1 todaviacutea es igual a 0400 En otras palabras existe unacia suficientemente grande entre b1 y 0400 para concluir que B1 ha cambiado respecto a histoacuterico Por esto sentimos que cada 100 horas adicionales de trabajo en auditoriacuteas de camaumentan la cantidad de descubrimientos de impuestos no pagados en $400000 como lo hel pasado

Ademaacutes de la prueba de hipoacutetesis podemos construir un intervalo de confianza para cude los valores de Bi Del mismo modo que bi es una estimacioacuten puntual de Bi estos intervalofianza son estimaciones de intervalo de Bi Para ilustrar el proceso de construccioacuten de interconfianza encontremos un intervalo de confianza del 95 para B3 en el ejemplo del IRS Lrelevantes son

b3 ϭ 0405 de la figura 13-2sb3 ϭ 00422

t ϭ 2447 larr Nivel de significancia del 5 y 6 grados de libertad

Intervalo deconfianza para B i

Realizacioacuten de la

prueba de hipoacutetesis

0597 ndash 0400ᎏᎏ

0081

b1 ndash B10ᎏ

sb1

Anaacute l i s i s de r e gr e s i oacutenLa ec uaci oacuten de r egr es i oacuten esDESCUBRE = - 45 0 + 0 597 AUDI TORIacute A + 1 18 COMPUTADORA + 0 405 RECOMPENSA

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 45 796 4 878 - 9 39 0 000AUDI TORIacute A 0 50697 0 08112 7 36 0 000COMPUTADORA 1 17684 0 08407 14 00 0 000RECOMPENSAS 0 40511 0 04223 9 59 0 000

s = 0 2861 R- s q = 98 3

FIGURA 13-2

Salida de Minitab(figura repetida)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2156

Con esta informacioacuten podemos calcular el intervalo de confianza de la siguiente manera

b3 ϩ t (sb3) ϭ 0405 ϩ 2447(00422)

ϭ 0508 larr Liacutemite superior

b3 Ϫ t (sb3) ϭ 0405 Ϫ 2447(00422)

ϭ 0302 larr Liacutemite inferior

Vemos que podemos tener una seguridad del 95 de que cada $1000 adicionales pagados a los formantes aumenta el descubrimiento de impuestos no pagados en una cantidad entre $302000$508000

A menudo estaremos interesados en preguntas del tipo iquesten realidad Y depende de X i Por ejeplo podriacuteamos preguntar si descubrir impuestos no pagados en realidad depende de las horas encomputadora Con frecuencia esta pregunta se plantea como iquestes X i una variable explicativa sigficativa de Y Si piensa un poco maacutes se convenceraacute de que si Bi 0 Y depende de las X i (esto esvariacutea cuando X i variacutea) y no depende de X i si Bi ϭ 0

Vemos que nuestra pregunta conduce a establecer hipoacutetesis de la forma

H0 Bi ϭ 0 larr Hipoacutetesis nula X i no es una variable explicativa significativa

H1 Bi 0 larr Hipoacutetesis alternativa X i es una variable explicativa significativa

Podemos probar estas hipoacutetesis utilizando la ecuacioacuten 13-8 del mismo modo que cuando probamnuestras hipoacutetesis acerca de si B1 todaviacutea era igual a 0400 Sin embargo existe una forma maacutes faacutede hacerlo usando la columna de la figura 13-2 de ldquocociente- t rdquo Observemos de nuevo la ecuaci13-8

t ϭ [13-

Como nuestro valor hipoteacutetico de Bi es cero el valor estandarizado del coeficiente de regresioacutedenotado por t o se convierte en

t o ϭ

El valor de t o se conoce como valor t ldquocalculadordquo Eacuteste es el nuacutemero que aparece en la columna equetada como ldquocociente-t rdquo en la figura 13-2 Denotemos por t c el valor t ldquocriacuteticordquo que buscamos

la tabla 2 del apeacutendice Entonces como la prueba para determinar si X i es una variable explicatisignificativa es una prueba de dos colas soacutelo necesitamos verificar si Ϫt c Յ t o Յ t c

Uso de valores t

calculados en lasalida de Minitab

biᎏ

sbi

bi ndash Bi0ᎏ

sbi

iquestEs significativa unavariable explicativa

Prueba para determinar si una variable es o no significativa

Ϫt c Յ t o Յ t c [13-9

donde

bull t c ϭ valor t adecuado (con n Ϫ k Ϫ 1 grados de libertad) para el nivel de significancia deprueba

bull t o ϭ bi sbi ϭ valor t observado (o calculado) obtenido con el paquete de software

Si t o

cae entre Ϫt c

y t c aceptamos H0 y llegamos a la conclusioacuten de que X

ino es una variable exp

cativa significativa En cualquier otro caso rechazamos H0 y concluimos que X i es una variable eplicativa significativa

Probemos al nivel de significancia de 001 si las horas en computadora constituyen una variabexplicativa significativa para los impuestos no pagados descubiertos De la tabla 2 del apeacutendice cn Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad y ϭ 001 vemos que t c ϭ 3707 De la figura 13tenemos que t o = 1400 Como t o Ͼ t c concluimos que el tiempo en computadora es una variab

Prueba de lasignificancia de lavariable horas decomputadora en elproblema del IRS

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2256

explicativa significativa De hecho al observar los valores t calculados para las otras dos vindependientes (tiempo de auditoriacuteas de campo t o ϭ 736 y recompensa a informantes t ovemos que tambieacuten son variables explicativas significativas

Podemos tambieacuten utilizar la columna de ldquoprdquo para probar si X i es una variable explicativacativa De hecho utilizando esa informacioacuten ni siquiera necesitamos usar la tabla 2 del aLos elementos de esta columna son los valores prob para las hipoacutetesis

H0 Biϭ 0

H1 Bi 0

Recuerde del anaacutelisis hecho en el capiacutetulo 9 que estos valores prob constituyen la probabque cada bi esteacute tan lejos de cero como (o maacutes) el valor observado obtenido de la regresioacutenverdadera Como se ilustra en la figura 13-3 solamente necesitamos comparar estos valocon el nivel de significancia de la prueba para determinar si X i es o no una variable expsignificativa para Y

Probar la significancia de una variable explicativa es siempre una prueba de dos colas Lble independiente X i es una variable explicativa significativa si bi es significativamente dife

cero es decir si t o es un nuacutemero grande positivo o negativoPara el ejemplo del IRS repetimos las pruebas con ϭ 001 Para cada una de las tres v

independientes p es menor que 001 de forma que podemos concluir que cada una de ellanificativa

Inferencias acerca de la regresioacuten como un todo

(usando una prueba F )

Suponga que cubre con papel un tablero para dardos y lanza varios dardos sobre eacutel Despueacuteberlo hecho tendraacute algo muy parecido a un diagrama de dispersioacuten Suponga entonces quuna recta de regresioacuten a este conjunto de ldquopuntos observadosrdquo y calcula r

2 Debido a que lofueron lanzados aleatoriamente usted espera obtener un valor bajo de r

2 puesto que en esten realidad no explica a Y Sin embargo si hace esto muchas veces ocasionalmente observalor alto de r

2 por pura casualidadDada cualquier regresioacuten simple (o muacuteltiple) es natural preguntarse si el valor de r2 (

realmente indica que las variables independientes explican a Y o si esto sucede por cas

A menudo esta interrogante se plantea de la siguiente manera iquestla regresioacuten como un todo ficativa En la uacuteltima seccioacuten vimos coacutemo decidir si una X i individual es una variable exp

Significancia de laregresioacuten comoun todo

FIGURA 13-3

Uso de ldquoprdquo paradeterminar si X i esuna variable expli-cativa significativa

Regioacuten de aceptacioacuten Regioacuten de aceptacioacuten

2 del aacuterea

2 del aacuterea

2 del aacuterea

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

ndasht c

ndasht o

t o

t c

0

(a) p es mayor que X

i no es una variable

explicativa significativa

(b) p es menor que X

i es una variable

explicativa significativa

ndasht o

ndasht c

t c

0

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2356

significativa ahora veremos coacutemo decidir si todas las X i tomadas en conjunto explican significavamente la variabilidad observada de Y Nuestras hipoacutetesis son

H0 B1 ϭ B2 ϭ ϭ Bk ϭ 0 larr Hipoacutetesis nula Y no depende de las X i

H1 por lo menos una Bi 0 larr Hipoacutetesis alternativa Y depende de al menos una de las X i

Cuando analizamos r 2 en el capiacutetulo 12 consideramos la variacioacuten total en Y sum(Y Ϫ Y ෆ )2 la p

te de dicha variacioacuten que explica la regresioacuten sum(Y ˆ Ϫ Y ෆ )2 y la parte no explicada de la variacioacutensum(Y Ϫ Y ˆ )2 La figura 13-4 es un duplicado de la figura 12-15 Sirve como repaso de la relacioacuten etre la desviacioacuten total la desviacioacuten explicada y la desviacioacuten no explicada para un solo dato en uregresioacuten simple Aunque no podamos dibujar una figura similar para una regresioacuten muacuteltiple coceptualmente estamos haciendo lo mismo

Al analizar la variacioacuten en Y fijamos nuestra atencioacuten en tres teacuterminos diferentes cada uno de cuales es una suma de cuadrados Los denotamos con

Suma de cuadradosy sus grados delibertad

Anaacutelisis de lavariacioacuten de losvalores Y

FIGURA 13-4

Desviacioacuten totaldesviacioacutenexplicada ydesviacioacuten noexplicada paraun valor observadode Y

Y

X

Un valor observado de lavariable dependiente (Y )

R e c t a d

e r e g r e s

i oacute n

Desviacioacuten no explicada de esta Y respectoa su media Y

(Y ndash Y )^

Desviacioacuten explicada deesta Y respecto a su media Y

(Y ndash Y )^Y

Valor estimado de esta Y

a partir de la recta de regresioacuten (Y )^

Desviacioacuten total de esta Y

respecto a su media Y

(Y ndash Y )

Tres sumas de cuadrados

SCT ϭ suma de cuadrados total (es decir la parte explicada) ϭ sum(Y Ϫ Y ෆ )2

SCR ϭ suma de cuadrados de la regresioacuten (es decir la parte explicada) ϭ sum(Y ˆ Ϫ Y ෆ )2 [13-10

SCE ϭ suma de cuadrados del error (es decir la parte no explicada) ϭ sum(Y Ϫ Y ˆ )2

Estaacuten relacionadas por la ecuacioacuten

que dice que la variacioacuten total en Y puede dividirse en dos partes la parte explicada y la no explicaCada una de estas sumas de cuadrados tiene un nuacutemero asociado de grados de libertad SCT t

ne n Ϫ 1 grados de libertad (n observaciones menos un grado de libertad debido a que la media la muestra estaacute fija) SCR tiene k grados de libertad porque existen k variables independientes qse utilizaron para explicar Y Finalmente SCE tiene n Ϫ k Ϫ 1 grados de libertad porque utilizamnuestras n observaciones para estimar k ϩ 1 constantes a b1 b2 bk Si la hipoacutetesis nula es ci

ta el cociente

Descomposicioacuten de la variacioacuten total de Y

SCT ϭ SCR ϩ SCE [13-1

Cociente F

F ϭ [13-12SCR k ᎏᎏ

SCE(n ndash k ndash 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2456

tiene una distribucioacuten F con k grados de libertad en el numerador y n Ϫ k Ϫ 1 grados de libel denominador Si la hipoacutetesis nula es falsa entonces el cociente tiende a ser maacutes grande qula hipoacutetesis nula es verdadera De modo que si el cociente F es demasiado grande (seguacuten lo na el nivel de significancia de la prueba y el valor apropiado de la tabla 6 del apeacutendice) rechH0 y concluimos que la regresioacuten como un todo es significativa

La figura 13-5 presenta la salida de Minitab para el problema del IRS Esta parte del rincluye los cocientes F calculados para la regresioacuten en ocasiones llamado anaacutelisis de v

(ANOVA) para la regresioacuten Probablemente se pregunte si esto tiene algo que ver con el anaacutelisrianza que estudiamos en el capiacutetulo 11 La respuesta es siacute Aunque no lo hicimos es posibletrar que el anaacutelisis de varianza visto en el capiacutetulo 11 tambieacuten contempla la variacioacuten total las observaciones alrededor de la gran media y la divide en dos partes una explicada por lascias entre los distintos grupos (que corresponde a lo que llamamos varianza entre columnas)

no explicada por dichas diferencias (que corresponde a la varianza dentro de columnas) Estcisamente anaacutelogo a lo que acabamos de hacer en la ecuacioacuten 13-11Para el problema del IRS vemos que SCR ϭ 29109 (con k ϭ 3 grados de libertad) SCE

(con n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad) y que

F ϭ ϭ ϭ 11833

Los elementos en la columna ldquoMCrdquo son justo las sumas de cuadrados divididas entre sus glibertad Para 3 grados de libertad en el numerador y 6 en el denominador la tabla 6 del apeacutence que 978 es el liacutemite superior de la regioacuten de aceptacioacuten para un nivel de significancia El valor calculado de F 11833 estaacute muy por arriba de 978 de manera que se ve que la r

como un todo es altamente significativa Se puede llegar a la misma conclusioacuten si se observresultado del programa dice que ldquo prdquo es 0000 Debido a que este valor prob es menor que elsignificancia ϭ 001 se concluye que la regresioacuten completa es significativa De esta mapuede usar la p de ANOVA como prueba sin tener que utilizar la tabla 6 del apeacutendice para bvalor criacutetico de F Esto es anaacutelogo a la manera en que se usaron los valores de p en la figura ra probar la significancia de las variables explicativas individuales

Multicolinealidad en la regresioacuten muacuteltiple

En el anaacutelisis de regresioacuten muacuteltiple los coeficientes de regresioacuten a menudo se vuelven

confiables conforme aumenta el grado de correlacioacuten entre las variables independie

existe un alto nivel de correlacioacuten entre algunas de las variables independientes nos enfrenun problema que los estadiacutesticos llaman multicolinealidad

La multicolinealidad puede presentarse si deseamos estimar la recuperacioacuten de las ventaempresa y utilizamos tanto el nuacutemero de vendedores empleados como sus salarios totales Cvalores asociados con estas dos variables independientes tienen una correlacioacuten alta neceusar soacutelo un conjunto de ellos para realizar nuestra estimacioacuten De hecho al agregar una segriable que estaacute correlacionada con la primera se distorsionan los valores de los coeficientgresioacuten Sin embargo a menudo podemos predecir bien Y incluso cuando haya multicoline

Consideremos un ejemplo donde existe multicolinealidad para ver coacutemo afecta a la regresrante los 12 meses pasados el gerente del restaurante Pizza Shack ha estado poniendo unaanuncios en el perioacutedico local Los anuncios se programan y pagan el mes anterior a que ap

Un ejemplo demulticolinealidad

Definicioacuten y efecto dela multicolinealidad

9703ᎏ

0082

29109 3ᎏ

0491 6Prueba de lasignificancia de laregresioacuten en elproblema del Serviciode Contribuciones

Anaacutelisis devarianza parala regresioacuten

Prueba F de laregresioacuten como

un todo

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 29 1088 9 7029 118 52 0Er r or 6 0 4912 0 0819Tot al 9 29 6000

FIGURA 13-5Salida de Minitabanaacutelisis devarianza

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2556

Cada anuncio contiene un cupoacuten que permite llevarse dos pizzas pagando solamente la de mcio El gerente recolectoacute los datos de la tabla 13-4 y le gustariacutea utilizarlos para predecir las vpizzas

En las figuras 13-6 y 13-7 se dieron los resultados de Minitab para las regresiones respelas ventas totales sobre el nuacutemero de anuncios y sobre el costo

Para la regresioacuten sobre el nuacutemero de anuncios tenemos que el valor t observado es 395grados de libertad y un nivel de significancia de ϭ 001 se encontroacute que el valor t criacuteticdo de la tabla 2 del apeacutendice) es 3169 Como t o Ͼ t c (o de manera equivalente como p es m001) concluimos que el nuacutemero de anuncios es una variable explicativa altamente signifilas ventas totales Note tambieacuten que r 2 ϭ 610 de modo que el nuacutemero de anuncios explximadamente el 61 de la variacioacuten en las ventas de pizzas

Para la regresioacuten sobre el costo de los anuncios el valor t observado es 454 de modo qude los anuncios es una variable explicativa de las ventas totales todaviacutea maacutes significativa que ro de anuncios (para los que el valor t observado fue soacutelo 395) En esta regresioacuten r 2 ϭ 673

el costo de los anuncios explica aproximadamente el 67 de la variacioacuten de las ventas de pizComo ambas variables explicativas son altamente significativas por siacute mismas intentam

zar ambas en una regresioacuten muacuteltiple El resultado se presenta en la figura 13-8La regresioacuten muacuteltiple es altamente significativa como un todo ya que la p de ANOVA e

Uso de ambas varia-bles explicativas enuna regresioacuten muacuteltiple

Dos regresionessimples

Datos de ventas y anun-cios para el restaurantePizza Shack

Tabla 13-4 X 1 X 2 Y

Nuacutemero Costo de anuncios Venta tode anuncios publicados de pizz

Mes publicados (cientos de doacutelares) (miles de d

Mayo 12 139 436

Junio 11 120 380

Julio 9 93 301

Agosto 7 97 353

Septiembre 12 123 464

Octubre 8 114 342

Noviembre 6 93 302

Diciembre 13 143 407

Enero 8 102 385

Febrero 6 84 226

Marzo 8 112 376

Abril 10 111 352

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esVENTAS = 16 9 + 2 08 ANUNCI OS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 16 937 4 982 3 40 0 007ANUNCI OS 2 0832 0 5271 3 95 0 003

s = 4 206 R- s q = 61 0

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 1 276 31 276 31 15 62 Er r or 10 176 88 17 69Tot a l 11 453 19

Figura 13-6

Regresioacuten de lasventas sobre elnuacutemero deanuncios conMinitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2656

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2756

gar el nuacutemero de anuncios como segunda variable explicativa ademaacutes del costo de los anuncios eplica nada maacutes alrededor del 1 adicional de la variacioacuten de las ventas totales

En este punto es justo preguntarse iquestqueacute variable realmente explica la variacioacuten de las ventotales en la regresioacuten muacuteltiple La respuesta es que ambas la explican pero no podemos separ

sus contribuciones individuales debido a que estaacuten altamente correlacionadas entre siacute E

consecuencia sus coeficientes en la regresioacuten muacuteltiple tienen errores estaacutendar altos valore

calculados relativamente bajos y valores prob Ͼ | t | relativamente altos

iquestDe queacute manera nos afecta esta multicolinealidad Todaviacutea podemos hacer predicciones relativmente precisas cuando se encuentra presente note que para la regresioacuten muacuteltiple (la salida se dala figura 13-8) el error estaacutendar de la estimacioacuten que determina el ancho de los intervalos de co

fianza para las predicciones es 3989 mientras que para la regresioacuten simple con el costo de los anucios como variable explicativa (salida en la figura 13-7) tenemos se ϭ 3849 Lo que no podemhacer es predecir con mucha precisioacuten coacutemo cambiaraacuten las ventas si aumentamos en uno el nuacutemede anuncios La regresioacuten muacuteltiple dice que b1 ϭ 0625 (esto es cada anuncio aumenta las ventotales de pizzas alrededor de $625) pero el error estaacutendar de este coeficiente es 112 (es decir apximadamente $1120)

Las contribucionesindividuales nopueden separarse

Ejercicios 134

Ejercicios de autoevaluacioacuten

EA 13-4 Edith Pratt es una ocupada ejecutiva de una compantildeiacutea de transporte de carga a nivel nacional y va tara una junta porque no encuentra la salida de la regresioacuten muacuteltiple elaborada por un asistente Si la regsioacuten total es significativa al nivel 005 ella desea usar las salida de computadora como evidencia para fudamentar algunas ideas que expondraacute en la reunioacuten Sin embargo su ayudante estaacute enfermo De hectoda la informacioacuten que tiene de la regresioacuten muacuteltiple es un trozo de papel con los siguientes datos

Regresioacuten paraEdith Pratt

SCR 8724 con gl

SCE con 17 gl

SCT 10236 con 24 gl

Como el papel ni siquiera tiene todos los nuacutemeros Edith ha concluido que no es uacutetil Usted sin embardebe saber maacutes que ella iquestPuede Edith entrar en la junta o debe seguir buscando la salida de computador

EA 13-5 Una pequentildea liacutenea aeacuterea de Nueva Inglaterra realizoacute una encuesta sobre sus 15 terminales y obtuvo losguientes datos para el mes de febrero donde

VENTAS ϭ ingreso total seguacuten el nuacutemero de boletos vendidos (en miles de doacutelares)

PROMOCϭ cantidad gastada en promociones de la liacutenea aeacuterea en el aacuterea (en miles de doacutelares)

COMPET ϭ nuacutemero de liacuteneas aeacutereas que compiten en esa terminal

GRATIS ϭ nuacutemero de pasajeros que vuelan gratis (por diferentes razones)

Sugerencia el concepto de hacer infe-rencias respecto a una regresioacuten muacutelti-ple es justo lo mismo que se hizo en elcapiacutetulo 12 cuando hicimos inferencias

respecto a una recta de regresioacuten excepto que ahora se em-

plean dos o maacutes variables independientes Advertencia lamulticolinealidad es un problema que debe manejarse enla regresioacuten muacuteltiple y es necesario desarrollar una com-prensioacuten con sentido comuacuten Recuerde que todaviacutea puedehacer predicciones precisas cuando estaacute presente Pero re-cuerde tambieacuten que no puede decir con mucha precisioacuten

cuaacutento cambiaraacute la variable dependiente si ldquomanipulardquo lavariables independientes Entonces el objetivo debe seminimizar la multicolinealidad Sugerencia la mejor regresioacuten muacuteltiple es la que explica la relacioacuten entre los datos asentildealar la responsabilidad de la mayor proporcioacuten de la va

riacioacuten en la variable dependiente con el menor nuacutemero dvariables independientes Advertencia no es una buenidea incluir demasiadas variables independientes soacutelo porque cuenta con una computadora y un paquete de softwarpara estadiacutestica

SUGERENCIAS

Y

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2856

Ventas (doacutelares) Promoc (doacutelares) Compet Gratis

793 25 10 3

2001 55 8 6

1632 60 12 9

2001 79 7 16

1460 52 8 15

1777 76 12 9

309 20 12 8

2919 90 5 10

1600 40 8 43394 96 5 16

1596 55 11 7

863 30 12 6

2375 60 6 10

1072 50 10 4

1550 35 10 4

a) Utilice la siguiente salida de Minitab para determinar la ecuacioacuten de regresioacuten que mejor se ara la liacutenea aeacuterea

La ec uaci oacuten de r egr es i oacuten esVENTAS ϭ 172 ϩ 25 9 PROMOVϪ 13 2 COMPET Ϫ 3 04 GRATI S

Pr onos t i cador Coef Des vEs t Coci ent e - t Cons t ant e 172 34 51 38 3 35 0PROMOV 25 950 4 877 5 32 0COMPET - 13 238 3 686 - 3 59 0GRATI S - 3 041 2 342 - 1 30 0

b) iquestLos pasajeros que vuelan gratis ocasionan una disminucioacuten significativa en las ventas Fpruebe las hipoacutetesis apropiadas Use ϭ 005

c) iquestUn incremento de $1000 en las promociones cambia las ventas en $28000 o el cambio ecativamente diferente de $28000 Formule y pruebe las hipoacutetesis adecuadas Use ϭ 010

d) Calcule un intervalo de confianza del 90 para el coeficiente de la pendiente de la COMPET

Aplicaciones

13-22 Mark Lowtown publica el perioacutedico Mosquito Junction Enquirer y tiene problemas para predectidad de papel perioacutedico que necesita imprimir diariamente Eligioacute aleatoriamente 27 diacuteas del arior y registroacute la siguiente informacioacuten

PESO ϭ peso en libras de papel perioacutedico para la edicioacuten de ese diacutea

CLASIFICADOS ϭ nuacutemero de anuncios clasificados

PUBLICIDAD ϭ nuacutemero de anuncios publicitarios

PLANA COMPLETA ϭ nuacutemero de anuncios a una plana

Utilizando Minitab para hacer una regresioacuten de PESO sobre las otras tres variables Mark obtuguiente salida

Pr onos t i cador Coef Des vEs t Coci ent e- t Cons t ant e 1072 95 872 43 1 23 0CLASI FI CADOS 0 251 0 126 1 99 0PUBLI CI DAD 1 250 0 884 1 41 0PLANA COMPLETA 250 66 67 92 3 69 0

a) Mark siempre ha pensado que cada anuncio publicitario utiliza al menos 3 libras de papel iquestsioacuten le da una razoacuten significativa para dudar esto al nivel del 5

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2956

b) De manera similar Mark siempre ha creiacutedo que cada anuncio clasificado utiliza aproximmedia libra de papel iquestTiene ahora Mark una razoacuten significativa para dudar esto al nivel del

c) Mark vende espacios de anuncios de plana completa a los comerciantes locales a $30 la paacutegberaacute pensar en ajustar sus tarifas si el papel perioacutedico le cuesta $009 por libra Suponga costos son despreciables Establezca expliacutecitamente las hipoacutetesis y una conclusioacuten (Sugere

jando todo lo demaacutes constante cada anuncio adicional de plana completa tiene un costo de bras de papel ϫ $009 por libra ϭ $2256 El punto de equilibrio es 333333 libras iquestPor quel coeficiente de pendiente para PLANA COMPLETA es significativamente mayor que Mark no estaacute obteniendo ganancias y debe cambiar sus tarifas)

13-23 Para los datos del ejercicio 13-18 y un nivel de significancia de 010 iquestcuaacuteles variables son sign

mente explicativas de los resultados de los exaacutemenes (Habiacutea 12 estudiantes en la muestra) 13-24 Para los datos del ejercicio 13-18 y la siguiente salida de Minitab del procedimiento de regresiple hecho por Bill

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 3134 42 783 60Er r or 7 951 25 135 89Tot a l 11 4085 67

a) iquestCuaacutel es el valor observado de F b) A un nivel de significancia de 005 iquestcuaacutel es el valor criacutetico de F que se debe utilizar para d

si la regresioacuten como un todo es significativac) Basaacutendose en las respuestas a los incisos a) y b) iquestes la regresioacuten significativa como un tod

13-25 Remiacutetase al ejercicio 13-19 A un nivel de significancia de 001 iquestes la variable DISTANCIA uble explicativa significativa para VENTAS

13-26 Para los datos del ejercicio 13-19 y la siguiente salida adicional de Minitab al correr la regresioacuten

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 2861495 715374 102 39 0Er r or 18 125761 6896 7Tot a l 22 2987256

Al nivel de significancia de 005 iquestes la regresioacuten significativa como un todo

13-27 Henry Lander es el director de produccioacuten de la Alecos Corporation de Caracas Venezuela Hede que le ayude a determinar una foacutermula para predecir el ausentismo de los empacadores de chipoacutetesis es que la temperatura diaria promedio puede explicar el porcentaje de ausentismo Durios meses reuacutene datos ejecuta el procedimiento de regresioacuten simple y encuentra que la tempeplica 66 de la variacioacuten en el ausentismo Pero Henry no estaacute convencido de que eacuteste sea un cador satisfactorio Sugiere que la precipitacioacuten pluvial diaria podriacutea tambieacuten tener algo que vausentismo de modo que registra los datos correspondientes y hace una regresioacuten del ausentismte el tiempo de lluvias y obtiene un valor R2 de 059 ldquoiexclEurekardquo grita usted ldquoiexclLo tengo Con uticador que explica 66 y otro que explica 59 todo lo que tengo que hacer es una regresioacutenutilizando ambos y seguramente tendreacute un pronosticador casi perfectordquo Para su desaacutenimo sin la regresioacuten muacuteltiple tiene una R

2 de soacutelo 68 que es solamente un poco mejor que la variablperatura sola iquestCoacutemo puede explicar esta aparente discrepancia

13-28 Juan Armenlegg administrador de Rockyrsquos Diamond y Jewelry Store estaacute interesado en desamodelo para estimar la demanda del consumidor para su costosa mercanciacutea Como la mayoriacutea de

tes compran diamantes y joyas a creacutedito Juan estaacute seguro de que dos factores que deben influirmanda de los clientes son la tasa real de inflacioacuten anual y la tasa real de intereses sobre preacutestamprincipales bancos del paiacutes Explique algunos problemas que Juan podriacutea encontrar si fuera a dun modelo de regresioacuten basado en estas dos variables de prediccioacuten

13-29 Un nuevo programa de juegos Check That Model pide a los concursantes que especifiquen el nuacutenimo de paraacutemetros que necesitan para determinar si un modelo de regresioacuten muacuteltiple es signifimo un todo para ϭ 001 Usted ganoacute la apuesta con 4 paraacutemetros Use la siguiente informacioacutenterminar si la regresioacuten es significativa

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3056

R 2

ϭ 07452

SCE ϭ 1254

n ϭ 18

Nuacutemero de variables independientes ϭ 3

13-30 La Scottish Turist Agency estaacute interesada en el nuacutemero de turistas que entran al paiacutes cada semanrante la temporada alta Se recolectaron los siguientes datos

Turistas (Y ) ϭ nuacutemero de turistas que entran a Escocia en una semana (en miles)

Cambio (X 1)ϭ nuacutemero de libras escocesas compradas por $1 doacutelar

Precio (X 2) ϭ nuacutemero de libras escocesas cobradas por viaje redondo en camioacuten de Londres a Edimburgo

Promoc (X 3) ϭ cantidad gastada en promocioacuten del paiacutes (en miles de libras escocesas)Temp (X 4) ϭ temperatura media durante la semana en Edimburgo (en grados Celsius)

Turistas (Y ) Cambio (X 1) Precio (X 2) Promoc (X 3) Temp (X 4)

69 061 40 87 154

71 059 40 88 156

68 063 40 85 154

79 061 35 86 153

76 060 35 94 158

82 065 35 99 162

80 058 35 98 164

84 059 35 102 166

97 061 30 114 174

98 062 30 116 172

72 057 40 84 176

67 055 40 86 164

a) Utilice el paquete de software que tenga para determinar la ecuacioacuten de regresioacuten que mejote a los datos de la agencia de turismo

b) iquestEs la tasa de cambio una variable explicativa significativa Establezca y pruebe las hipoacutetesidas a un nivel de significancia de 010

c) Un incremento de 1000 libras en las promociones iquestaumenta el nuacutemero de turistas en maacutesEstablezca y pruebe las hipoacutetesis adecuadas para un nivel de significancia de 005

d) Calcule un intervalo de confianza del 95 para el coeficiente de la pendiente de Temp

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-4 Como SCT ϭ SCR ϩ SCE SCE ϭ SCT Ϫ SCR ϭ 10236 Ϫ 8724 ϭ 1512Como gl SCT ϭ gl SCR ϩ gl SCE gl SCR ϭ gl SCT Ϫ gl SCE ϭ 24 Ϫ 17 ϭ 7

Entonces F ϭ ϭ ϭ 1401

F CRiacuteT ϭ F (7 17 005) ϭ 261Como F OBS gt F CRIacuteT se concluye que la regresioacuten es significativa como un todo Edith debe conticando la salida de computadora de la regresioacuten para usarla en la junta

EA 13-5 De la salida de computadora se obti enen los siguientes resultadosa) VENTAS ϭ 17234 ϩ 25950PROMOC Ϫ13238COMPET Ϫ 3041GRATISb) H0 BGRATIS ϭ 0 H1 BGRATIS Ͻ 0 ϭ 005

Eacutesta es una prueba de una cola y el valor prob en los resultados es para la alternativa de dos c BGRATIS 0 De manera que para esta prueba el valor prob es 02212 ϭ 0111 Ͼ ϭ 00que no se puede rechazar H0 las ventas no disminuyen significativamente cuando aumenta ro de pasajeros que vuelan gratis

c) H0 BPROMOC ϭ 28 H1 BPROMOC 28 ϭ 010

87247ᎏᎏ

151217SCRk ᎏᎏ

SCE(n Ϫ k Ϫ 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3156

El valor observado t de los resultados de regresioacuten es

ϭ ϭ Ϫ0420

Con 11 grados de libertad y ϭ 010 en ambas colas combinadas los valores criacuteticos t parba son Ϯ1796 asiacute el valor observado estaacute dentro de la regioacuten de aceptacioacuten No se rechacambio en VENTAS para un incremento de una unidad ($1000) en PROMOC no es significate diferente de 28 ($28000)

d) Con 11 grados de libertad el valor t para un intervalo del 90 de confianza es 1796 por lo

tervalo esbCOMP Ϯ 1796sbCOMP

ϭ Ϫ13238 Ϯ 1796(3686)

ϭ Ϫ13238 Ϯ 6620 ϭ (Ϫ19858 Ϫ 6618)

La liacutenea aeacuterea puede tener una seguridad del 90 de que el ingreso por los boletos en una ofminuye entre $6600 y $19900 aproximadamente con cada liacutenea aeacuterea adicional que comp

135 Teacutecnicas de modelado

Dada una variable que deseamos explicar y un conjunto de variables explicativas potencialehaya varias ecuaciones de regresioacuten diferentes que podamos estudiar dependiendo de queacute explicativas incluyamos y de coacutemo lo hagamos Cada una de esas ecuaciones de regresioacutence como modelo Las teacutecnicas de modelado son las distintas formas en que podemos incluriables explicativas y verificar queacute tan apropiados son los modelos de regresioacuten Existen municas de modelado diferentes pero soacutelo veremos dos de las maacutes utilizadas

Datos cualitativos y variables ficticias

En todos los ejemplos de regresioacuten que hemos visto hasta ahora los datos manejados hanmeacutericos o cuantitativos Pero ocasionalmente nos enfrentaremos con una variable categoacuterilitativa En el problema del inicio el capiacutetulo el director de personal desea ver si el salarioun vendedor depende de su sexo En la tabla 13-5 repetimos los datos de dicho problema

Por el momento ignore la antiguumledad y utilice la teacutecnica desarrollada en el capiacutetulo 9 bar la diferencia entre las medias de dos poblaciones para ver si los hombres ganan maacutes qu

jeres Pruebe con ϭ 001 Si tomamos a los hombres como la poblacioacuten 1 y a las mujerespoblacioacuten 2 probaremos las siguientes hipoacutetesis

H0 1 ϭ 2 larr Hipoacutetesis nula no existe discriminacioacuten por sexo en los salarios base

H1 1 Ͼ 2 larr Hipoacutetesis alternativa se discrimina a las mujeres en su salario base

ϭ 001 larr Nivel de significancia

Revisioacuten del enfoqueanterior del problema

Buacutesqueda dediferentes modelos

25950 Ϫ 28ᎏᎏ

4877

(bPROMOC Ϫ 28)ᎏᎏ

sbPROMOC

Datos para el problemade discriminacioacuten porsexo

Tabla 13-5 Vendedores VendedorasAntiguumledad Salario base Antiguumledad Salario base(en meses) (en miles) (en meses) (en miles)

6 75 5 62

10 86 13 87

12 91 15 94

18 103 21 98

30 130

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3256

A continuacioacuten bosquejamos el anaacutelisis Si tiene problemas para seguirlo deberaacute repasamente la seccioacuten 93

n1 ϭ 5 n2 ϭ 4

x ෆ1 ϭ 97 x ෆ2 ϭ 8525

s2

1 ϭ 4415 s2

2 ϭ 2609

s2

p ϭ

ϭ

ϭ 3641

x ෆ1Ϫ x

ෆ2ϭ s pΊ ϩ

ϭ 128

t ϭ

ϭ

ϭ 092

Con siete grados de libertad el valor t criacutetico para una prueba de cola superior con ϭ 001 eComo el valor t observado de 092 es menor que 2998 no podemos rechazar H0

Entonces el anaacutelisis concluye que no parece haber discriminacioacuten por sexo en los salarPero recuerde que hasta ahora se han ignorado los datos de antiguumledad laboral para el anaacuteli

Antes de seguir vea el diagrama de dispersioacuten de los datos En la figura 13-9 los punto

corresponden a los hombres y los blancos a las mujeres El diagrama de dispersioacuten muestraridad que el salario base aumenta con los antildeos de antiguumledad pero si con la mirada sigue lo qla recta de regresioacuten notaraacute que los puntos negros tienden a estar arriba de ella y los blancos

La figura 13-10 da la salida de una regresioacuten del salario base sobre los meses de antiguumlelos resultados se ve que la antiguumledad es una variable explicativa altamente significativa

Ademaacutes r 2

ϭ 926 que indica que la variable meses de antiguumledad explica cerca del 9variacioacuten en el salario base La figura 13-11 contiene parte de la salida que no se vio antesbla de residuos Para cada punto el residuo es simplemente Y Ϫ Y ˆ que se reconoce como el

Una ldquomiradardquo a los

datos

El enfoque anterior nodetecta discriminacioacuten

(97 ndash 8525) ndash 0ᎏᎏ

128

( x ෆ1 ndash x ෆ2) ndash (1 Ϫ 2)H0

ᎏᎏᎏ

ˆ x ෆ1Ϫ

x ෆ2

1ᎏ

n2

1ᎏ

n1

4(4415) ϩ 3(2609)ᎏᎏᎏ5 ϩ 4 ndash 2

(n1 ndash 1)s21 ϩ (n2 ndash 1)s22ᎏᎏᎏ

n1 ϩ n2 ndash 2

FIGURA 13-9

Diagrama de dis-persioacuten de salariosbase contra mesesde antiguumledad

4 8 12 16 20 24 28

4

8

12

Meses de antiguumledad

S a l a r i o ( m i l e s d e d oacute l a r e s )

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3356

el ajuste de la recta de regresioacuten en ese punto En la figura 13-11 AJUST1 son los valores y RESI1 son los residuos

Tal vez la parte maacutes importante del anaacutelisis del resultado de una regresioacuten sea estusiduos Si la regresioacuten incluye todos los factores explicativos relevantes estos residuo

ser aleatorios Dicho de otro modo si los residuos muestran cualquier patroacuten no aleat

to indica que hay algo sistemaacutetico que afecta el proceso y que no hemos tomado en cu

manera que buscamos patrones en los residuos o para decirlo de forma maacutes pintoresca ldquopmos a los residuos hasta hacerlos hablarrdquo

Si observamos los residuos presentados en la figura 13-11 vemos que los primeros cincoson positivos De modo que para los vendedores tenemos Y ndash Y ˆ Ͼ 0 o Y Ͼ Y ˆ es decir laregresioacuten cae abajo de estos cinco puntos Tres de los cuatro uacuteltimos residuos son negaticonsiguiente para las vendedoras tenemos Y Ϫ Y ˆ Ͻ 0 o Y Ͻ Y ˆ asiacute que la recta de regresicuentra arriba de tres de los cuatro puntos Esto confirma lo que vimos al observar el diagdispersioacuten de la figura 13-9 Este patroacuten no aleatorio en los residuos sugiere que el sexo siacute etor determinante del salario base

iquestCoacutemo podemos incorporar el sexo de los vendedores dentro del modelo de regresioacutencemos utilizando un dispositivo llamado variable ficticia (o variable indicadora) Para lpuntos que representan a los vendedores esta variable tiene valor de 0 y para los cuatro purepresentan a las vendedoras valdraacute 1 Los datos de entrada para nuestra regresioacuten con variticias se dan en la tabla 13-6

Para los datos de la tabla 13-6 se ajusta una regresioacuten de la forma

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

Uso de variablesficticias

Deteccioacuten depatrones en losresiduos

ldquoPresionar a losresiduosrdquo

Anaacutel i s i s de r e gr e s i oacuten

La ec uac i oacuten de r e gr es i oacuten esSALARI O ϭ 5 81 ϩ 0 233 MESES

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t pCons t a nt e 5 8093 0 4038 14 39 0 000MESES 0 23320 0 02492 9 36 0 000

s ϭ 0 5494 R- s q ϭ 92 6

Anaacute l i s i s de va r i a nz aFUENTE GL SC MC F Re gr e s i oacuten 1 26 443 24 443 87 61 0Er r or 7 2 113 0 302Tot a l 8 28 556

FIGURA 13-10

Regresioacuten conMinitab del salariobase sobre losmeses deantiguumledad

RENGLOacuteN SALARI O AJ UST1 RESI 1

1 7 5 7 2085 0 2914992 8 6 8 1413 0 458684

3 9 1 8 6077 0 4922764 10 3 10 0069 0 2930545 13 0 12 8054 0 1946076 6 2 6 9753 - 0 7752977 8 7 8 8409 - 0 1409288 9 4 9 3073 0 0926649 9 8 10 7066 - 0 906558

FIGURA 13-11

Tabla de residuosde Minitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1756

Los datos se analizaron con Minitab y la salida es la siguiente

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t Cons t a nt e 175 37 92 62 1 89 0 0AUTOS - 0 028 0 315 minus0 09 0 9ENTRADA 3 775 1 272 2 97 0 0I NGANUAL 1 990 4 510 0 44 0 6DI STANCI A 212 41 28 090 7 56 0 0

s = 85 587 R- s q = 95 8

a) iquestCuaacutel es la ecuacioacuten de regresioacuten de mejor ajuste dada por Minitab

b) iquestCuaacutel es el error estaacutendar de la estimacioacuten para esta ecuacioacutenc) iquestQueacute fraccioacuten de la variacioacuten en las ventas se explica con esta regresioacutend) iquestQueacute ventas predeciriacutea para una tienda localizada en un vecindario que tuvo un ingreso anu

milia de $20000 estaba a 2 millas del supermercado maacutes cercano se encontraba en una calvolumen promedio semanal de traacutensito de 100000 autos y con una facilidad de entrada de

13-20 Rick Blackburn estaacute pensando en vender su casa Con el fin de decidir el precio que pediraacute poreunido datos de 12 ventas recientes Registroacute el precio de venta (en miles de doacutelares) el nuacutemercuadrados de construccioacuten (en cientos de pies cuadrados) el nuacutemero de pisos el nuacutemero de bantiguumledad de la casa (en antildeos)

Precio de venta Pies cuad Pisos Bantildeos Antiguumledad

4965 89 1 10 2

6795 95 1 10 68115 126 2 15 11

8160 129 2 15 8

9150 190 2 10 22

9525 176 1 10 17

10035 200 2 15 12

10425 206 2 15 11

11265 205 1 20 9

14970 251 2 20 8

16065 227 2 20 18

23250 408 3 40 12

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de

de mejor ajuste para los datosb) iquestCuaacutel es el valor de R2 para esta ecuacioacutenc) Si la casa de Rick tiene 1800 pies cuadrados (ϭ 180 cientos de pies cuadrados) un piso

y seis antildeos de antiguumledad iquestqueacute precio de venta puede esperar Rick 13-21 La Allegheny Steel Corporation ha estado buscando los factores que influyen en la cantidad de

millones de toneladas) que puede vender cada antildeo La administracioacuten sospecha que los siguientfactores principales la tasa anual de inflacioacuten del paiacutes el precio promedio por tonelada del acetado que acota los precios (en doacutelares) de Allegheny y el nuacutemero de automoacuteviles (en millonesfabricantes de autos de Estados Unidos planean producir ese antildeo Se recolectaron los datos de losiete antildeos

Y X 2 X 3

Millones X 1 Cota de Nuacutemero

de tons Tasa de importa- deAntildeo vendidas inflacioacuten ciones automoacuteviles

1993 42 31 310 62

1992 31 39 500 51

1991 40 75 220 57

1990 47 107 450 71

1989 43 155 435 65

1988 37 130 260 61

1987 35 110 305 59

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1856

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de regresioacutende mejor ajuste para los datos

b) iquestQueacute porcentaje de la variacioacuten total de la cantidad de acero vendido (en millones de toneladas) porAllegheny cada antildeo explica esta ecuacioacuten

c) iquestCuaacutentas toneladas de acero deberaacute esperar Allegheny vender en un antildeo en el que la tasa de inflacioacutenes 71 los fabricantes de automoacuteviles norteamericanos planean producir 60 millones de autos y la co-ta promedio del acero importado por tonelada es $350

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-3 De la salida del paquete de software se obtienen los siguientes resultadosa) Y ˆ ϭ Ϫ1275 ϩ 17059 X 1 ϩ 05406 X 2 Ϫ 01743 X 3b) R

2ϭ 872 el modelo explica el 872 de la variacioacuten total en Y

c) Y ˆ ϭ Ϫ1275 ϩ 17059(169) ϩ 05406(10212) Ϫ 01743(26925) ϭ 2436 reembolsos de impuestos

134 Inferencias sobre paraacutemetrosde poblacioacuten

En el capiacutetulo 12 se vio que la recta de regresioacuten de la muestra Y ˆ ϭ a ϩ bX (ecuacioacuten 12-3) esti-maba la recta de regresioacuten de la poblacioacuten Y ϭ A ϩ BX (ecuacioacuten 12-13) La razoacuten por la cual soacute-lo podiacuteamos estimar la recta de regresioacuten de poblacioacuten y no determinarla con exactitud era que los

puntos no caen exactamente en la recta de regresioacuten de la poblacioacuten Debido a las variaciones alea-torias los puntos satisfaciacutean Y ϭ A ϩ BX ϩ e (ecuacioacuten 12-13a) maacutes que a Y ϭ A ϩ BX

En la regresioacuten muacuteltiple se tiene justo la misma situacioacuten Nuestro plano de regresioacuten estimado

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k [13-5]

es una estimacioacuten de un plano de regresioacuten de poblacioacuten verdadero pero desconocido de la forma

Plano de regresioacutende la poblacioacuten

De nuevo los puntos individuales normalmente no caen con exactitud en el plano de regresioacuten depoblacioacuten Consideremos el problema del Servicio Interno de Contribuciones para ver por queacute Notodos los pagos a informantes tendraacuten la misma efectividad Algunas horas en computadora podriacuteanutilizarse para recolectar y organizar datos otras para analizar esos datos en busca de errores y frau-des El eacutexito de la computadora en descubrir impuestos no pagados puede depender de cuaacutento tiempose dedique a cada una de estas actividades Por eacutestas y otras razones algunos de los puntos se en-contraraacuten arriba del plano de regresioacuten y algunos estaraacuten abajo de eacuteste En lugar de satisfacer laecuacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

los puntos individuales satisfaraacuten la ecuacioacuten

Las variaciones alea-torias desplazan lospuntos del plano deregresioacuten

Ecuacioacuten de regresioacuten de la poblacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

Plano de regresioacuten de la poblacioacuten maacutes la variacioacuten aleatoria

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e [13-7a]

La cantidad e que aparece en la ecuacioacuten 13-7a es una variacioacuten aleatoria que en promedio es iguala cero La desviacioacuten estaacutendar de las variaciones individuales e y el error estaacutendar de la estima-cioacuten se que estudiamos en la seccioacuten anterior es una estimacioacuten de e

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1956

Como nuestro plano de regresioacuten de la muestra Y ˆ ϭ a ϩ b1X1 ϩ b2 X 2 ϩ ϩ bk X k (ecuaci13-7) estima el plano de regresioacuten de poblacioacuten desconocido Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk

(ecuacioacuten 13-7) deberemos ser capaces de usarlo para hacer inferencias sobre el plano de regreside la poblacioacuten En esta seccioacuten haremos inferencias acerca de las pendientes ( B1 B2 Bk ) deecuacioacuten de regresioacuten ldquoverdaderardquo (la que se aplica a la poblacioacuten completa) basadas en las pendietes (b1 b2 bk ) de la ecuacioacuten de regresioacuten estimada a partir de la muestra de datos

Inferencias acerca de una pendiente individual B i El plano de regresioacuten se deriva de una muestra y no de la poblacioacuten completa Como resultado

podemos esperar que la ecuacioacuten de regresioacuten verdadera Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k que se aplica a la poblacioacuten completa) sea exactamente igual que la ecuacioacuten estimada a partir observaciones de la muestra Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k Sin embargo podemos utilizarvalor de bi una de las pendientes que calculamos a partir de la muestra para probar hipoacutetesis acca del valor de Bi una de las pendientes del plano de regresioacuten para la poblacioacuten completa

El procedimiento para probar una hipoacutetesis respecto a Bi es parecido al procedimiento analizaen los capiacutetulos 8 y 9 sobre pruebas de hipoacutetesis Para entender este proceso regresemos al probma que relaciona los impuestos no pagados descubiertos con las horas de trabajo en auditoriacuteas campo horas en computadora y recompensas a informantes En la paacutegina 729 sentildealamos que b10597 El primer paso consiste en encontrar un valor para B1 y compararlo con b1 ϭ 0597

Suponga que durante un periodo largo la pendiente de la relacioacuten entre Y y X 1 fue 0400 Paprobar si todaviacutea es vaacutelida podriacuteamos definir las hipoacutetesis como

H0 B1 ϭ 0400 larr Hipoacutetesis nula

H1 B1 0400 larr Hipoacutetesis alternativa

De hecho realizamos la prueba para saber si los datos actuales indican que B1 ha cambiado su vahistoacuterico de 0400

Para encontrar el estadiacutestico de prueba para B1 es necesario hallar primero el error estaacutendar d

coeficiente de regresioacuten El coeficiente de regresioacuten con el que estamos trabajando es b1 de moque el error estaacutendar de este coeficiente se representa con sb1

Resulta demasiado difiacutecil calcular sb1 a mano pero por fortuna Minitab calcula los errores estaacutedar de todos los coeficientes de regresioacuten Por comodidad repetimos la figura 13-2 Los errores taacutendar de los coeficientes se dan en la columna DesvEst de la salida de Minitab

En el cuadro de salida vemos que sb1

es 00811 (Similarmente si deseamos probar una hipoacutesis acerca de B2 vemos que el error estaacutendar apropiado que debemos utilizar es sb2 ϭ 00841) Uvez que encontramos sb1 en la salida de Minitab podemos usar la ecuacioacuten 13-8 para estandarizarpendiente de nuestra ecuacioacuten de regresioacuten ajustada

Estandarizacioacutendel coeficiente deregresioacuten

Error estaacutendar delcoeficientede regresioacuten

Prueba de unahipoacutetesis acerca de B i

Diferencia entre la

ecuacioacuten de regre-sioacuten verdadera y unaestimada a partir delas observacionesde la muestra

Coeficiente de regresioacuten estandarizado

t ϭ [13-8bi ndash Bi0ᎏ

sbi

donde

bull biϭ pendiente de la regresioacuten ajustada

bull Bi0 ϭ pendiente real hipoteacutetica para la poblacioacutenbull sbi ϭ error estaacutendar del coeficiente de regresioacuten

iquestPor queacute utilizamos t para denotar el estadiacutestico estandarizado Recuerde que en la regresioacuten siple utilizamos a y b en la ecuacioacuten 12-7 para calcular se y que se estimaba e la desviacioacuten estaacutedar de las variaciones de los datos (ecuacioacuten 12-13a) Entonces utilizamos se en la ecuacioacuten 12-para encontrar sb el error estaacutendar del coeficiente de regresioacuten que corresponde a la pendiente E

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2056

pezamos con n puntos y los usamos para estimar los dos coeficientes a y b Luego basamtras pruebas en la distribucioacuten t con n Ϫ 2 grados de libertad

De manera similar en la regresioacuten muacuteltiple tambieacuten empezamos con n puntos pero lospara estimar k ϩ 1 coeficientes la ordenada a y k pendientes b1 b2 bk Despueacutes estcientes se usan en la ecuacioacuten 13-6 para calcular se que de nuevo es una estimacioacuten de eviacioacuten estaacutendar de las variaciones de los datos (ecuacioacuten 13-7a) Luego se utiliza se (en ucioacuten que estaacute maacutes allaacute del alcance de este libro) para encontrar s

bi Debido a lo anterior

nuestras pruebas de hipoacutetesis en la distribucioacuten t con n Ϫ k Ϫ 1 (ϭ n Ϫ ( k ϩ l)) grados de En nuestro ejemplo el valor estandarizado del coeficiente de regresioacuten es

t ϭ

ϭ

ϭ 2432 larr Coeficiente de regresioacuten estandarizado

Suponga que estamos interesados en probar nuestras hipoacutetesis al nivel de significancia

Como tenemos 10 observaciones en la muestra y tres variables independientes sabemos n Ϫ k Ϫ 1 o 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad Buscamos en la tabla 2 del apeacutendice en lana de 10 y el rengloacuten de 6 grados de libertad Ahiacute vemos que el valor apropiado de t es 19mo nos preocupa si b1 (la pendiente del plano de regresioacuten de la muestra) es significativamferente de B1 (la pendiente hipoteacutetica del plano de regresioacuten de la poblacioacuten) eacutesta es una pdos colas y los valores criacuteticos son Ϯ1943 El coeficiente de regresioacuten estandarizado es 2se encuentra fuera de la regioacuten de aceptacioacuten de nuestra prueba de hipoacutetesis Por consiguichazamos la hipoacutetesis nula de que B1 todaviacutea es igual a 0400 En otras palabras existe unacia suficientemente grande entre b1 y 0400 para concluir que B1 ha cambiado respecto a histoacuterico Por esto sentimos que cada 100 horas adicionales de trabajo en auditoriacuteas de camaumentan la cantidad de descubrimientos de impuestos no pagados en $400000 como lo hel pasado

Ademaacutes de la prueba de hipoacutetesis podemos construir un intervalo de confianza para cude los valores de Bi Del mismo modo que bi es una estimacioacuten puntual de Bi estos intervalofianza son estimaciones de intervalo de Bi Para ilustrar el proceso de construccioacuten de interconfianza encontremos un intervalo de confianza del 95 para B3 en el ejemplo del IRS Lrelevantes son

b3 ϭ 0405 de la figura 13-2sb3 ϭ 00422

t ϭ 2447 larr Nivel de significancia del 5 y 6 grados de libertad

Intervalo deconfianza para B i

Realizacioacuten de la

prueba de hipoacutetesis

0597 ndash 0400ᎏᎏ

0081

b1 ndash B10ᎏ

sb1

Anaacute l i s i s de r e gr e s i oacutenLa ec uaci oacuten de r egr es i oacuten esDESCUBRE = - 45 0 + 0 597 AUDI TORIacute A + 1 18 COMPUTADORA + 0 405 RECOMPENSA

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 45 796 4 878 - 9 39 0 000AUDI TORIacute A 0 50697 0 08112 7 36 0 000COMPUTADORA 1 17684 0 08407 14 00 0 000RECOMPENSAS 0 40511 0 04223 9 59 0 000

s = 0 2861 R- s q = 98 3

FIGURA 13-2

Salida de Minitab(figura repetida)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2156

Con esta informacioacuten podemos calcular el intervalo de confianza de la siguiente manera

b3 ϩ t (sb3) ϭ 0405 ϩ 2447(00422)

ϭ 0508 larr Liacutemite superior

b3 Ϫ t (sb3) ϭ 0405 Ϫ 2447(00422)

ϭ 0302 larr Liacutemite inferior

Vemos que podemos tener una seguridad del 95 de que cada $1000 adicionales pagados a los formantes aumenta el descubrimiento de impuestos no pagados en una cantidad entre $302000$508000

A menudo estaremos interesados en preguntas del tipo iquesten realidad Y depende de X i Por ejeplo podriacuteamos preguntar si descubrir impuestos no pagados en realidad depende de las horas encomputadora Con frecuencia esta pregunta se plantea como iquestes X i una variable explicativa sigficativa de Y Si piensa un poco maacutes se convenceraacute de que si Bi 0 Y depende de las X i (esto esvariacutea cuando X i variacutea) y no depende de X i si Bi ϭ 0

Vemos que nuestra pregunta conduce a establecer hipoacutetesis de la forma

H0 Bi ϭ 0 larr Hipoacutetesis nula X i no es una variable explicativa significativa

H1 Bi 0 larr Hipoacutetesis alternativa X i es una variable explicativa significativa

Podemos probar estas hipoacutetesis utilizando la ecuacioacuten 13-8 del mismo modo que cuando probamnuestras hipoacutetesis acerca de si B1 todaviacutea era igual a 0400 Sin embargo existe una forma maacutes faacutede hacerlo usando la columna de la figura 13-2 de ldquocociente- t rdquo Observemos de nuevo la ecuaci13-8

t ϭ [13-

Como nuestro valor hipoteacutetico de Bi es cero el valor estandarizado del coeficiente de regresioacutedenotado por t o se convierte en

t o ϭ

El valor de t o se conoce como valor t ldquocalculadordquo Eacuteste es el nuacutemero que aparece en la columna equetada como ldquocociente-t rdquo en la figura 13-2 Denotemos por t c el valor t ldquocriacuteticordquo que buscamos

la tabla 2 del apeacutendice Entonces como la prueba para determinar si X i es una variable explicatisignificativa es una prueba de dos colas soacutelo necesitamos verificar si Ϫt c Յ t o Յ t c

Uso de valores t

calculados en lasalida de Minitab

biᎏ

sbi

bi ndash Bi0ᎏ

sbi

iquestEs significativa unavariable explicativa

Prueba para determinar si una variable es o no significativa

Ϫt c Յ t o Յ t c [13-9

donde

bull t c ϭ valor t adecuado (con n Ϫ k Ϫ 1 grados de libertad) para el nivel de significancia deprueba

bull t o ϭ bi sbi ϭ valor t observado (o calculado) obtenido con el paquete de software

Si t o

cae entre Ϫt c

y t c aceptamos H0 y llegamos a la conclusioacuten de que X

ino es una variable exp

cativa significativa En cualquier otro caso rechazamos H0 y concluimos que X i es una variable eplicativa significativa

Probemos al nivel de significancia de 001 si las horas en computadora constituyen una variabexplicativa significativa para los impuestos no pagados descubiertos De la tabla 2 del apeacutendice cn Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad y ϭ 001 vemos que t c ϭ 3707 De la figura 13tenemos que t o = 1400 Como t o Ͼ t c concluimos que el tiempo en computadora es una variab

Prueba de lasignificancia de lavariable horas decomputadora en elproblema del IRS

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2256

explicativa significativa De hecho al observar los valores t calculados para las otras dos vindependientes (tiempo de auditoriacuteas de campo t o ϭ 736 y recompensa a informantes t ovemos que tambieacuten son variables explicativas significativas

Podemos tambieacuten utilizar la columna de ldquoprdquo para probar si X i es una variable explicativacativa De hecho utilizando esa informacioacuten ni siquiera necesitamos usar la tabla 2 del aLos elementos de esta columna son los valores prob para las hipoacutetesis

H0 Biϭ 0

H1 Bi 0

Recuerde del anaacutelisis hecho en el capiacutetulo 9 que estos valores prob constituyen la probabque cada bi esteacute tan lejos de cero como (o maacutes) el valor observado obtenido de la regresioacutenverdadera Como se ilustra en la figura 13-3 solamente necesitamos comparar estos valocon el nivel de significancia de la prueba para determinar si X i es o no una variable expsignificativa para Y

Probar la significancia de una variable explicativa es siempre una prueba de dos colas Lble independiente X i es una variable explicativa significativa si bi es significativamente dife

cero es decir si t o es un nuacutemero grande positivo o negativoPara el ejemplo del IRS repetimos las pruebas con ϭ 001 Para cada una de las tres v

independientes p es menor que 001 de forma que podemos concluir que cada una de ellanificativa

Inferencias acerca de la regresioacuten como un todo

(usando una prueba F )

Suponga que cubre con papel un tablero para dardos y lanza varios dardos sobre eacutel Despueacuteberlo hecho tendraacute algo muy parecido a un diagrama de dispersioacuten Suponga entonces quuna recta de regresioacuten a este conjunto de ldquopuntos observadosrdquo y calcula r

2 Debido a que lofueron lanzados aleatoriamente usted espera obtener un valor bajo de r

2 puesto que en esten realidad no explica a Y Sin embargo si hace esto muchas veces ocasionalmente observalor alto de r

2 por pura casualidadDada cualquier regresioacuten simple (o muacuteltiple) es natural preguntarse si el valor de r2 (

realmente indica que las variables independientes explican a Y o si esto sucede por cas

A menudo esta interrogante se plantea de la siguiente manera iquestla regresioacuten como un todo ficativa En la uacuteltima seccioacuten vimos coacutemo decidir si una X i individual es una variable exp

Significancia de laregresioacuten comoun todo

FIGURA 13-3

Uso de ldquoprdquo paradeterminar si X i esuna variable expli-cativa significativa

Regioacuten de aceptacioacuten Regioacuten de aceptacioacuten

2 del aacuterea

2 del aacuterea

2 del aacuterea

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

ndasht c

ndasht o

t o

t c

0

(a) p es mayor que X

i no es una variable

explicativa significativa

(b) p es menor que X

i es una variable

explicativa significativa

ndasht o

ndasht c

t c

0

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2356

significativa ahora veremos coacutemo decidir si todas las X i tomadas en conjunto explican significavamente la variabilidad observada de Y Nuestras hipoacutetesis son

H0 B1 ϭ B2 ϭ ϭ Bk ϭ 0 larr Hipoacutetesis nula Y no depende de las X i

H1 por lo menos una Bi 0 larr Hipoacutetesis alternativa Y depende de al menos una de las X i

Cuando analizamos r 2 en el capiacutetulo 12 consideramos la variacioacuten total en Y sum(Y Ϫ Y ෆ )2 la p

te de dicha variacioacuten que explica la regresioacuten sum(Y ˆ Ϫ Y ෆ )2 y la parte no explicada de la variacioacutensum(Y Ϫ Y ˆ )2 La figura 13-4 es un duplicado de la figura 12-15 Sirve como repaso de la relacioacuten etre la desviacioacuten total la desviacioacuten explicada y la desviacioacuten no explicada para un solo dato en uregresioacuten simple Aunque no podamos dibujar una figura similar para una regresioacuten muacuteltiple coceptualmente estamos haciendo lo mismo

Al analizar la variacioacuten en Y fijamos nuestra atencioacuten en tres teacuterminos diferentes cada uno de cuales es una suma de cuadrados Los denotamos con

Suma de cuadradosy sus grados delibertad

Anaacutelisis de lavariacioacuten de losvalores Y

FIGURA 13-4

Desviacioacuten totaldesviacioacutenexplicada ydesviacioacuten noexplicada paraun valor observadode Y

Y

X

Un valor observado de lavariable dependiente (Y )

R e c t a d

e r e g r e s

i oacute n

Desviacioacuten no explicada de esta Y respectoa su media Y

(Y ndash Y )^

Desviacioacuten explicada deesta Y respecto a su media Y

(Y ndash Y )^Y

Valor estimado de esta Y

a partir de la recta de regresioacuten (Y )^

Desviacioacuten total de esta Y

respecto a su media Y

(Y ndash Y )

Tres sumas de cuadrados

SCT ϭ suma de cuadrados total (es decir la parte explicada) ϭ sum(Y Ϫ Y ෆ )2

SCR ϭ suma de cuadrados de la regresioacuten (es decir la parte explicada) ϭ sum(Y ˆ Ϫ Y ෆ )2 [13-10

SCE ϭ suma de cuadrados del error (es decir la parte no explicada) ϭ sum(Y Ϫ Y ˆ )2

Estaacuten relacionadas por la ecuacioacuten

que dice que la variacioacuten total en Y puede dividirse en dos partes la parte explicada y la no explicaCada una de estas sumas de cuadrados tiene un nuacutemero asociado de grados de libertad SCT t

ne n Ϫ 1 grados de libertad (n observaciones menos un grado de libertad debido a que la media la muestra estaacute fija) SCR tiene k grados de libertad porque existen k variables independientes qse utilizaron para explicar Y Finalmente SCE tiene n Ϫ k Ϫ 1 grados de libertad porque utilizamnuestras n observaciones para estimar k ϩ 1 constantes a b1 b2 bk Si la hipoacutetesis nula es ci

ta el cociente

Descomposicioacuten de la variacioacuten total de Y

SCT ϭ SCR ϩ SCE [13-1

Cociente F

F ϭ [13-12SCR k ᎏᎏ

SCE(n ndash k ndash 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2456

tiene una distribucioacuten F con k grados de libertad en el numerador y n Ϫ k Ϫ 1 grados de libel denominador Si la hipoacutetesis nula es falsa entonces el cociente tiende a ser maacutes grande qula hipoacutetesis nula es verdadera De modo que si el cociente F es demasiado grande (seguacuten lo na el nivel de significancia de la prueba y el valor apropiado de la tabla 6 del apeacutendice) rechH0 y concluimos que la regresioacuten como un todo es significativa

La figura 13-5 presenta la salida de Minitab para el problema del IRS Esta parte del rincluye los cocientes F calculados para la regresioacuten en ocasiones llamado anaacutelisis de v

(ANOVA) para la regresioacuten Probablemente se pregunte si esto tiene algo que ver con el anaacutelisrianza que estudiamos en el capiacutetulo 11 La respuesta es siacute Aunque no lo hicimos es posibletrar que el anaacutelisis de varianza visto en el capiacutetulo 11 tambieacuten contempla la variacioacuten total las observaciones alrededor de la gran media y la divide en dos partes una explicada por lascias entre los distintos grupos (que corresponde a lo que llamamos varianza entre columnas)

no explicada por dichas diferencias (que corresponde a la varianza dentro de columnas) Estcisamente anaacutelogo a lo que acabamos de hacer en la ecuacioacuten 13-11Para el problema del IRS vemos que SCR ϭ 29109 (con k ϭ 3 grados de libertad) SCE

(con n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad) y que

F ϭ ϭ ϭ 11833

Los elementos en la columna ldquoMCrdquo son justo las sumas de cuadrados divididas entre sus glibertad Para 3 grados de libertad en el numerador y 6 en el denominador la tabla 6 del apeacutence que 978 es el liacutemite superior de la regioacuten de aceptacioacuten para un nivel de significancia El valor calculado de F 11833 estaacute muy por arriba de 978 de manera que se ve que la r

como un todo es altamente significativa Se puede llegar a la misma conclusioacuten si se observresultado del programa dice que ldquo prdquo es 0000 Debido a que este valor prob es menor que elsignificancia ϭ 001 se concluye que la regresioacuten completa es significativa De esta mapuede usar la p de ANOVA como prueba sin tener que utilizar la tabla 6 del apeacutendice para bvalor criacutetico de F Esto es anaacutelogo a la manera en que se usaron los valores de p en la figura ra probar la significancia de las variables explicativas individuales

Multicolinealidad en la regresioacuten muacuteltiple

En el anaacutelisis de regresioacuten muacuteltiple los coeficientes de regresioacuten a menudo se vuelven

confiables conforme aumenta el grado de correlacioacuten entre las variables independie

existe un alto nivel de correlacioacuten entre algunas de las variables independientes nos enfrenun problema que los estadiacutesticos llaman multicolinealidad

La multicolinealidad puede presentarse si deseamos estimar la recuperacioacuten de las ventaempresa y utilizamos tanto el nuacutemero de vendedores empleados como sus salarios totales Cvalores asociados con estas dos variables independientes tienen una correlacioacuten alta neceusar soacutelo un conjunto de ellos para realizar nuestra estimacioacuten De hecho al agregar una segriable que estaacute correlacionada con la primera se distorsionan los valores de los coeficientgresioacuten Sin embargo a menudo podemos predecir bien Y incluso cuando haya multicoline

Consideremos un ejemplo donde existe multicolinealidad para ver coacutemo afecta a la regresrante los 12 meses pasados el gerente del restaurante Pizza Shack ha estado poniendo unaanuncios en el perioacutedico local Los anuncios se programan y pagan el mes anterior a que ap

Un ejemplo demulticolinealidad

Definicioacuten y efecto dela multicolinealidad

9703ᎏ

0082

29109 3ᎏ

0491 6Prueba de lasignificancia de laregresioacuten en elproblema del Serviciode Contribuciones

Anaacutelisis devarianza parala regresioacuten

Prueba F de laregresioacuten como

un todo

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 29 1088 9 7029 118 52 0Er r or 6 0 4912 0 0819Tot al 9 29 6000

FIGURA 13-5Salida de Minitabanaacutelisis devarianza

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2556

Cada anuncio contiene un cupoacuten que permite llevarse dos pizzas pagando solamente la de mcio El gerente recolectoacute los datos de la tabla 13-4 y le gustariacutea utilizarlos para predecir las vpizzas

En las figuras 13-6 y 13-7 se dieron los resultados de Minitab para las regresiones respelas ventas totales sobre el nuacutemero de anuncios y sobre el costo

Para la regresioacuten sobre el nuacutemero de anuncios tenemos que el valor t observado es 395grados de libertad y un nivel de significancia de ϭ 001 se encontroacute que el valor t criacuteticdo de la tabla 2 del apeacutendice) es 3169 Como t o Ͼ t c (o de manera equivalente como p es m001) concluimos que el nuacutemero de anuncios es una variable explicativa altamente signifilas ventas totales Note tambieacuten que r 2 ϭ 610 de modo que el nuacutemero de anuncios explximadamente el 61 de la variacioacuten en las ventas de pizzas

Para la regresioacuten sobre el costo de los anuncios el valor t observado es 454 de modo qude los anuncios es una variable explicativa de las ventas totales todaviacutea maacutes significativa que ro de anuncios (para los que el valor t observado fue soacutelo 395) En esta regresioacuten r 2 ϭ 673

el costo de los anuncios explica aproximadamente el 67 de la variacioacuten de las ventas de pizComo ambas variables explicativas son altamente significativas por siacute mismas intentam

zar ambas en una regresioacuten muacuteltiple El resultado se presenta en la figura 13-8La regresioacuten muacuteltiple es altamente significativa como un todo ya que la p de ANOVA e

Uso de ambas varia-bles explicativas enuna regresioacuten muacuteltiple

Dos regresionessimples

Datos de ventas y anun-cios para el restaurantePizza Shack

Tabla 13-4 X 1 X 2 Y

Nuacutemero Costo de anuncios Venta tode anuncios publicados de pizz

Mes publicados (cientos de doacutelares) (miles de d

Mayo 12 139 436

Junio 11 120 380

Julio 9 93 301

Agosto 7 97 353

Septiembre 12 123 464

Octubre 8 114 342

Noviembre 6 93 302

Diciembre 13 143 407

Enero 8 102 385

Febrero 6 84 226

Marzo 8 112 376

Abril 10 111 352

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esVENTAS = 16 9 + 2 08 ANUNCI OS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 16 937 4 982 3 40 0 007ANUNCI OS 2 0832 0 5271 3 95 0 003

s = 4 206 R- s q = 61 0

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 1 276 31 276 31 15 62 Er r or 10 176 88 17 69Tot a l 11 453 19

Figura 13-6

Regresioacuten de lasventas sobre elnuacutemero deanuncios conMinitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2656

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2756

gar el nuacutemero de anuncios como segunda variable explicativa ademaacutes del costo de los anuncios eplica nada maacutes alrededor del 1 adicional de la variacioacuten de las ventas totales

En este punto es justo preguntarse iquestqueacute variable realmente explica la variacioacuten de las ventotales en la regresioacuten muacuteltiple La respuesta es que ambas la explican pero no podemos separ

sus contribuciones individuales debido a que estaacuten altamente correlacionadas entre siacute E

consecuencia sus coeficientes en la regresioacuten muacuteltiple tienen errores estaacutendar altos valore

calculados relativamente bajos y valores prob Ͼ | t | relativamente altos

iquestDe queacute manera nos afecta esta multicolinealidad Todaviacutea podemos hacer predicciones relativmente precisas cuando se encuentra presente note que para la regresioacuten muacuteltiple (la salida se dala figura 13-8) el error estaacutendar de la estimacioacuten que determina el ancho de los intervalos de co

fianza para las predicciones es 3989 mientras que para la regresioacuten simple con el costo de los anucios como variable explicativa (salida en la figura 13-7) tenemos se ϭ 3849 Lo que no podemhacer es predecir con mucha precisioacuten coacutemo cambiaraacuten las ventas si aumentamos en uno el nuacutemede anuncios La regresioacuten muacuteltiple dice que b1 ϭ 0625 (esto es cada anuncio aumenta las ventotales de pizzas alrededor de $625) pero el error estaacutendar de este coeficiente es 112 (es decir apximadamente $1120)

Las contribucionesindividuales nopueden separarse

Ejercicios 134

Ejercicios de autoevaluacioacuten

EA 13-4 Edith Pratt es una ocupada ejecutiva de una compantildeiacutea de transporte de carga a nivel nacional y va tara una junta porque no encuentra la salida de la regresioacuten muacuteltiple elaborada por un asistente Si la regsioacuten total es significativa al nivel 005 ella desea usar las salida de computadora como evidencia para fudamentar algunas ideas que expondraacute en la reunioacuten Sin embargo su ayudante estaacute enfermo De hectoda la informacioacuten que tiene de la regresioacuten muacuteltiple es un trozo de papel con los siguientes datos

Regresioacuten paraEdith Pratt

SCR 8724 con gl

SCE con 17 gl

SCT 10236 con 24 gl

Como el papel ni siquiera tiene todos los nuacutemeros Edith ha concluido que no es uacutetil Usted sin embardebe saber maacutes que ella iquestPuede Edith entrar en la junta o debe seguir buscando la salida de computador

EA 13-5 Una pequentildea liacutenea aeacuterea de Nueva Inglaterra realizoacute una encuesta sobre sus 15 terminales y obtuvo losguientes datos para el mes de febrero donde

VENTAS ϭ ingreso total seguacuten el nuacutemero de boletos vendidos (en miles de doacutelares)

PROMOCϭ cantidad gastada en promociones de la liacutenea aeacuterea en el aacuterea (en miles de doacutelares)

COMPET ϭ nuacutemero de liacuteneas aeacutereas que compiten en esa terminal

GRATIS ϭ nuacutemero de pasajeros que vuelan gratis (por diferentes razones)

Sugerencia el concepto de hacer infe-rencias respecto a una regresioacuten muacutelti-ple es justo lo mismo que se hizo en elcapiacutetulo 12 cuando hicimos inferencias

respecto a una recta de regresioacuten excepto que ahora se em-

plean dos o maacutes variables independientes Advertencia lamulticolinealidad es un problema que debe manejarse enla regresioacuten muacuteltiple y es necesario desarrollar una com-prensioacuten con sentido comuacuten Recuerde que todaviacutea puedehacer predicciones precisas cuando estaacute presente Pero re-cuerde tambieacuten que no puede decir con mucha precisioacuten

cuaacutento cambiaraacute la variable dependiente si ldquomanipulardquo lavariables independientes Entonces el objetivo debe seminimizar la multicolinealidad Sugerencia la mejor regresioacuten muacuteltiple es la que explica la relacioacuten entre los datos asentildealar la responsabilidad de la mayor proporcioacuten de la va

riacioacuten en la variable dependiente con el menor nuacutemero dvariables independientes Advertencia no es una buenidea incluir demasiadas variables independientes soacutelo porque cuenta con una computadora y un paquete de softwarpara estadiacutestica

SUGERENCIAS

Y

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2856

Ventas (doacutelares) Promoc (doacutelares) Compet Gratis

793 25 10 3

2001 55 8 6

1632 60 12 9

2001 79 7 16

1460 52 8 15

1777 76 12 9

309 20 12 8

2919 90 5 10

1600 40 8 43394 96 5 16

1596 55 11 7

863 30 12 6

2375 60 6 10

1072 50 10 4

1550 35 10 4

a) Utilice la siguiente salida de Minitab para determinar la ecuacioacuten de regresioacuten que mejor se ara la liacutenea aeacuterea

La ec uaci oacuten de r egr es i oacuten esVENTAS ϭ 172 ϩ 25 9 PROMOVϪ 13 2 COMPET Ϫ 3 04 GRATI S

Pr onos t i cador Coef Des vEs t Coci ent e - t Cons t ant e 172 34 51 38 3 35 0PROMOV 25 950 4 877 5 32 0COMPET - 13 238 3 686 - 3 59 0GRATI S - 3 041 2 342 - 1 30 0

b) iquestLos pasajeros que vuelan gratis ocasionan una disminucioacuten significativa en las ventas Fpruebe las hipoacutetesis apropiadas Use ϭ 005

c) iquestUn incremento de $1000 en las promociones cambia las ventas en $28000 o el cambio ecativamente diferente de $28000 Formule y pruebe las hipoacutetesis adecuadas Use ϭ 010

d) Calcule un intervalo de confianza del 90 para el coeficiente de la pendiente de la COMPET

Aplicaciones

13-22 Mark Lowtown publica el perioacutedico Mosquito Junction Enquirer y tiene problemas para predectidad de papel perioacutedico que necesita imprimir diariamente Eligioacute aleatoriamente 27 diacuteas del arior y registroacute la siguiente informacioacuten

PESO ϭ peso en libras de papel perioacutedico para la edicioacuten de ese diacutea

CLASIFICADOS ϭ nuacutemero de anuncios clasificados

PUBLICIDAD ϭ nuacutemero de anuncios publicitarios

PLANA COMPLETA ϭ nuacutemero de anuncios a una plana

Utilizando Minitab para hacer una regresioacuten de PESO sobre las otras tres variables Mark obtuguiente salida

Pr onos t i cador Coef Des vEs t Coci ent e- t Cons t ant e 1072 95 872 43 1 23 0CLASI FI CADOS 0 251 0 126 1 99 0PUBLI CI DAD 1 250 0 884 1 41 0PLANA COMPLETA 250 66 67 92 3 69 0

a) Mark siempre ha pensado que cada anuncio publicitario utiliza al menos 3 libras de papel iquestsioacuten le da una razoacuten significativa para dudar esto al nivel del 5

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2956

b) De manera similar Mark siempre ha creiacutedo que cada anuncio clasificado utiliza aproximmedia libra de papel iquestTiene ahora Mark una razoacuten significativa para dudar esto al nivel del

c) Mark vende espacios de anuncios de plana completa a los comerciantes locales a $30 la paacutegberaacute pensar en ajustar sus tarifas si el papel perioacutedico le cuesta $009 por libra Suponga costos son despreciables Establezca expliacutecitamente las hipoacutetesis y una conclusioacuten (Sugere

jando todo lo demaacutes constante cada anuncio adicional de plana completa tiene un costo de bras de papel ϫ $009 por libra ϭ $2256 El punto de equilibrio es 333333 libras iquestPor quel coeficiente de pendiente para PLANA COMPLETA es significativamente mayor que Mark no estaacute obteniendo ganancias y debe cambiar sus tarifas)

13-23 Para los datos del ejercicio 13-18 y un nivel de significancia de 010 iquestcuaacuteles variables son sign

mente explicativas de los resultados de los exaacutemenes (Habiacutea 12 estudiantes en la muestra) 13-24 Para los datos del ejercicio 13-18 y la siguiente salida de Minitab del procedimiento de regresiple hecho por Bill

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 3134 42 783 60Er r or 7 951 25 135 89Tot a l 11 4085 67

a) iquestCuaacutel es el valor observado de F b) A un nivel de significancia de 005 iquestcuaacutel es el valor criacutetico de F que se debe utilizar para d

si la regresioacuten como un todo es significativac) Basaacutendose en las respuestas a los incisos a) y b) iquestes la regresioacuten significativa como un tod

13-25 Remiacutetase al ejercicio 13-19 A un nivel de significancia de 001 iquestes la variable DISTANCIA uble explicativa significativa para VENTAS

13-26 Para los datos del ejercicio 13-19 y la siguiente salida adicional de Minitab al correr la regresioacuten

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 2861495 715374 102 39 0Er r or 18 125761 6896 7Tot a l 22 2987256

Al nivel de significancia de 005 iquestes la regresioacuten significativa como un todo

13-27 Henry Lander es el director de produccioacuten de la Alecos Corporation de Caracas Venezuela Hede que le ayude a determinar una foacutermula para predecir el ausentismo de los empacadores de chipoacutetesis es que la temperatura diaria promedio puede explicar el porcentaje de ausentismo Durios meses reuacutene datos ejecuta el procedimiento de regresioacuten simple y encuentra que la tempeplica 66 de la variacioacuten en el ausentismo Pero Henry no estaacute convencido de que eacuteste sea un cador satisfactorio Sugiere que la precipitacioacuten pluvial diaria podriacutea tambieacuten tener algo que vausentismo de modo que registra los datos correspondientes y hace una regresioacuten del ausentismte el tiempo de lluvias y obtiene un valor R2 de 059 ldquoiexclEurekardquo grita usted ldquoiexclLo tengo Con uticador que explica 66 y otro que explica 59 todo lo que tengo que hacer es una regresioacutenutilizando ambos y seguramente tendreacute un pronosticador casi perfectordquo Para su desaacutenimo sin la regresioacuten muacuteltiple tiene una R

2 de soacutelo 68 que es solamente un poco mejor que la variablperatura sola iquestCoacutemo puede explicar esta aparente discrepancia

13-28 Juan Armenlegg administrador de Rockyrsquos Diamond y Jewelry Store estaacute interesado en desamodelo para estimar la demanda del consumidor para su costosa mercanciacutea Como la mayoriacutea de

tes compran diamantes y joyas a creacutedito Juan estaacute seguro de que dos factores que deben influirmanda de los clientes son la tasa real de inflacioacuten anual y la tasa real de intereses sobre preacutestamprincipales bancos del paiacutes Explique algunos problemas que Juan podriacutea encontrar si fuera a dun modelo de regresioacuten basado en estas dos variables de prediccioacuten

13-29 Un nuevo programa de juegos Check That Model pide a los concursantes que especifiquen el nuacutenimo de paraacutemetros que necesitan para determinar si un modelo de regresioacuten muacuteltiple es signifimo un todo para ϭ 001 Usted ganoacute la apuesta con 4 paraacutemetros Use la siguiente informacioacutenterminar si la regresioacuten es significativa

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3056

R 2

ϭ 07452

SCE ϭ 1254

n ϭ 18

Nuacutemero de variables independientes ϭ 3

13-30 La Scottish Turist Agency estaacute interesada en el nuacutemero de turistas que entran al paiacutes cada semanrante la temporada alta Se recolectaron los siguientes datos

Turistas (Y ) ϭ nuacutemero de turistas que entran a Escocia en una semana (en miles)

Cambio (X 1)ϭ nuacutemero de libras escocesas compradas por $1 doacutelar

Precio (X 2) ϭ nuacutemero de libras escocesas cobradas por viaje redondo en camioacuten de Londres a Edimburgo

Promoc (X 3) ϭ cantidad gastada en promocioacuten del paiacutes (en miles de libras escocesas)Temp (X 4) ϭ temperatura media durante la semana en Edimburgo (en grados Celsius)

Turistas (Y ) Cambio (X 1) Precio (X 2) Promoc (X 3) Temp (X 4)

69 061 40 87 154

71 059 40 88 156

68 063 40 85 154

79 061 35 86 153

76 060 35 94 158

82 065 35 99 162

80 058 35 98 164

84 059 35 102 166

97 061 30 114 174

98 062 30 116 172

72 057 40 84 176

67 055 40 86 164

a) Utilice el paquete de software que tenga para determinar la ecuacioacuten de regresioacuten que mejote a los datos de la agencia de turismo

b) iquestEs la tasa de cambio una variable explicativa significativa Establezca y pruebe las hipoacutetesidas a un nivel de significancia de 010

c) Un incremento de 1000 libras en las promociones iquestaumenta el nuacutemero de turistas en maacutesEstablezca y pruebe las hipoacutetesis adecuadas para un nivel de significancia de 005

d) Calcule un intervalo de confianza del 95 para el coeficiente de la pendiente de Temp

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-4 Como SCT ϭ SCR ϩ SCE SCE ϭ SCT Ϫ SCR ϭ 10236 Ϫ 8724 ϭ 1512Como gl SCT ϭ gl SCR ϩ gl SCE gl SCR ϭ gl SCT Ϫ gl SCE ϭ 24 Ϫ 17 ϭ 7

Entonces F ϭ ϭ ϭ 1401

F CRiacuteT ϭ F (7 17 005) ϭ 261Como F OBS gt F CRIacuteT se concluye que la regresioacuten es significativa como un todo Edith debe conticando la salida de computadora de la regresioacuten para usarla en la junta

EA 13-5 De la salida de computadora se obti enen los siguientes resultadosa) VENTAS ϭ 17234 ϩ 25950PROMOC Ϫ13238COMPET Ϫ 3041GRATISb) H0 BGRATIS ϭ 0 H1 BGRATIS Ͻ 0 ϭ 005

Eacutesta es una prueba de una cola y el valor prob en los resultados es para la alternativa de dos c BGRATIS 0 De manera que para esta prueba el valor prob es 02212 ϭ 0111 Ͼ ϭ 00que no se puede rechazar H0 las ventas no disminuyen significativamente cuando aumenta ro de pasajeros que vuelan gratis

c) H0 BPROMOC ϭ 28 H1 BPROMOC 28 ϭ 010

87247ᎏᎏ

151217SCRk ᎏᎏ

SCE(n Ϫ k Ϫ 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3156

El valor observado t de los resultados de regresioacuten es

ϭ ϭ Ϫ0420

Con 11 grados de libertad y ϭ 010 en ambas colas combinadas los valores criacuteticos t parba son Ϯ1796 asiacute el valor observado estaacute dentro de la regioacuten de aceptacioacuten No se rechacambio en VENTAS para un incremento de una unidad ($1000) en PROMOC no es significate diferente de 28 ($28000)

d) Con 11 grados de libertad el valor t para un intervalo del 90 de confianza es 1796 por lo

tervalo esbCOMP Ϯ 1796sbCOMP

ϭ Ϫ13238 Ϯ 1796(3686)

ϭ Ϫ13238 Ϯ 6620 ϭ (Ϫ19858 Ϫ 6618)

La liacutenea aeacuterea puede tener una seguridad del 90 de que el ingreso por los boletos en una ofminuye entre $6600 y $19900 aproximadamente con cada liacutenea aeacuterea adicional que comp

135 Teacutecnicas de modelado

Dada una variable que deseamos explicar y un conjunto de variables explicativas potencialehaya varias ecuaciones de regresioacuten diferentes que podamos estudiar dependiendo de queacute explicativas incluyamos y de coacutemo lo hagamos Cada una de esas ecuaciones de regresioacutence como modelo Las teacutecnicas de modelado son las distintas formas en que podemos incluriables explicativas y verificar queacute tan apropiados son los modelos de regresioacuten Existen municas de modelado diferentes pero soacutelo veremos dos de las maacutes utilizadas

Datos cualitativos y variables ficticias

En todos los ejemplos de regresioacuten que hemos visto hasta ahora los datos manejados hanmeacutericos o cuantitativos Pero ocasionalmente nos enfrentaremos con una variable categoacuterilitativa En el problema del inicio el capiacutetulo el director de personal desea ver si el salarioun vendedor depende de su sexo En la tabla 13-5 repetimos los datos de dicho problema

Por el momento ignore la antiguumledad y utilice la teacutecnica desarrollada en el capiacutetulo 9 bar la diferencia entre las medias de dos poblaciones para ver si los hombres ganan maacutes qu

jeres Pruebe con ϭ 001 Si tomamos a los hombres como la poblacioacuten 1 y a las mujerespoblacioacuten 2 probaremos las siguientes hipoacutetesis

H0 1 ϭ 2 larr Hipoacutetesis nula no existe discriminacioacuten por sexo en los salarios base

H1 1 Ͼ 2 larr Hipoacutetesis alternativa se discrimina a las mujeres en su salario base

ϭ 001 larr Nivel de significancia

Revisioacuten del enfoqueanterior del problema

Buacutesqueda dediferentes modelos

25950 Ϫ 28ᎏᎏ

4877

(bPROMOC Ϫ 28)ᎏᎏ

sbPROMOC

Datos para el problemade discriminacioacuten porsexo

Tabla 13-5 Vendedores VendedorasAntiguumledad Salario base Antiguumledad Salario base(en meses) (en miles) (en meses) (en miles)

6 75 5 62

10 86 13 87

12 91 15 94

18 103 21 98

30 130

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3256

A continuacioacuten bosquejamos el anaacutelisis Si tiene problemas para seguirlo deberaacute repasamente la seccioacuten 93

n1 ϭ 5 n2 ϭ 4

x ෆ1 ϭ 97 x ෆ2 ϭ 8525

s2

1 ϭ 4415 s2

2 ϭ 2609

s2

p ϭ

ϭ

ϭ 3641

x ෆ1Ϫ x

ෆ2ϭ s pΊ ϩ

ϭ 128

t ϭ

ϭ

ϭ 092

Con siete grados de libertad el valor t criacutetico para una prueba de cola superior con ϭ 001 eComo el valor t observado de 092 es menor que 2998 no podemos rechazar H0

Entonces el anaacutelisis concluye que no parece haber discriminacioacuten por sexo en los salarPero recuerde que hasta ahora se han ignorado los datos de antiguumledad laboral para el anaacuteli

Antes de seguir vea el diagrama de dispersioacuten de los datos En la figura 13-9 los punto

corresponden a los hombres y los blancos a las mujeres El diagrama de dispersioacuten muestraridad que el salario base aumenta con los antildeos de antiguumledad pero si con la mirada sigue lo qla recta de regresioacuten notaraacute que los puntos negros tienden a estar arriba de ella y los blancos

La figura 13-10 da la salida de una regresioacuten del salario base sobre los meses de antiguumlelos resultados se ve que la antiguumledad es una variable explicativa altamente significativa

Ademaacutes r 2

ϭ 926 que indica que la variable meses de antiguumledad explica cerca del 9variacioacuten en el salario base La figura 13-11 contiene parte de la salida que no se vio antesbla de residuos Para cada punto el residuo es simplemente Y Ϫ Y ˆ que se reconoce como el

Una ldquomiradardquo a los

datos

El enfoque anterior nodetecta discriminacioacuten

(97 ndash 8525) ndash 0ᎏᎏ

128

( x ෆ1 ndash x ෆ2) ndash (1 Ϫ 2)H0

ᎏᎏᎏ

ˆ x ෆ1Ϫ

x ෆ2

1ᎏ

n2

1ᎏ

n1

4(4415) ϩ 3(2609)ᎏᎏᎏ5 ϩ 4 ndash 2

(n1 ndash 1)s21 ϩ (n2 ndash 1)s22ᎏᎏᎏ

n1 ϩ n2 ndash 2

FIGURA 13-9

Diagrama de dis-persioacuten de salariosbase contra mesesde antiguumledad

4 8 12 16 20 24 28

4

8

12

Meses de antiguumledad

S a l a r i o ( m i l e s d e d oacute l a r e s )

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3356

el ajuste de la recta de regresioacuten en ese punto En la figura 13-11 AJUST1 son los valores y RESI1 son los residuos

Tal vez la parte maacutes importante del anaacutelisis del resultado de una regresioacuten sea estusiduos Si la regresioacuten incluye todos los factores explicativos relevantes estos residuo

ser aleatorios Dicho de otro modo si los residuos muestran cualquier patroacuten no aleat

to indica que hay algo sistemaacutetico que afecta el proceso y que no hemos tomado en cu

manera que buscamos patrones en los residuos o para decirlo de forma maacutes pintoresca ldquopmos a los residuos hasta hacerlos hablarrdquo

Si observamos los residuos presentados en la figura 13-11 vemos que los primeros cincoson positivos De modo que para los vendedores tenemos Y ndash Y ˆ Ͼ 0 o Y Ͼ Y ˆ es decir laregresioacuten cae abajo de estos cinco puntos Tres de los cuatro uacuteltimos residuos son negaticonsiguiente para las vendedoras tenemos Y Ϫ Y ˆ Ͻ 0 o Y Ͻ Y ˆ asiacute que la recta de regresicuentra arriba de tres de los cuatro puntos Esto confirma lo que vimos al observar el diagdispersioacuten de la figura 13-9 Este patroacuten no aleatorio en los residuos sugiere que el sexo siacute etor determinante del salario base

iquestCoacutemo podemos incorporar el sexo de los vendedores dentro del modelo de regresioacutencemos utilizando un dispositivo llamado variable ficticia (o variable indicadora) Para lpuntos que representan a los vendedores esta variable tiene valor de 0 y para los cuatro purepresentan a las vendedoras valdraacute 1 Los datos de entrada para nuestra regresioacuten con variticias se dan en la tabla 13-6

Para los datos de la tabla 13-6 se ajusta una regresioacuten de la forma

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

Uso de variablesficticias

Deteccioacuten depatrones en losresiduos

ldquoPresionar a losresiduosrdquo

Anaacutel i s i s de r e gr e s i oacuten

La ec uac i oacuten de r e gr es i oacuten esSALARI O ϭ 5 81 ϩ 0 233 MESES

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t pCons t a nt e 5 8093 0 4038 14 39 0 000MESES 0 23320 0 02492 9 36 0 000

s ϭ 0 5494 R- s q ϭ 92 6

Anaacute l i s i s de va r i a nz aFUENTE GL SC MC F Re gr e s i oacuten 1 26 443 24 443 87 61 0Er r or 7 2 113 0 302Tot a l 8 28 556

FIGURA 13-10

Regresioacuten conMinitab del salariobase sobre losmeses deantiguumledad

RENGLOacuteN SALARI O AJ UST1 RESI 1

1 7 5 7 2085 0 2914992 8 6 8 1413 0 458684

3 9 1 8 6077 0 4922764 10 3 10 0069 0 2930545 13 0 12 8054 0 1946076 6 2 6 9753 - 0 7752977 8 7 8 8409 - 0 1409288 9 4 9 3073 0 0926649 9 8 10 7066 - 0 906558

FIGURA 13-11

Tabla de residuosde Minitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1856

a) Utilice cualquier paquete de software que tenga disponible para determinar la ecuacioacuten de regresioacutende mejor ajuste para los datos

b) iquestQueacute porcentaje de la variacioacuten total de la cantidad de acero vendido (en millones de toneladas) porAllegheny cada antildeo explica esta ecuacioacuten

c) iquestCuaacutentas toneladas de acero deberaacute esperar Allegheny vender en un antildeo en el que la tasa de inflacioacutenes 71 los fabricantes de automoacuteviles norteamericanos planean producir 60 millones de autos y la co-ta promedio del acero importado por tonelada es $350

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-3 De la salida del paquete de software se obtienen los siguientes resultadosa) Y ˆ ϭ Ϫ1275 ϩ 17059 X 1 ϩ 05406 X 2 Ϫ 01743 X 3b) R

2ϭ 872 el modelo explica el 872 de la variacioacuten total en Y

c) Y ˆ ϭ Ϫ1275 ϩ 17059(169) ϩ 05406(10212) Ϫ 01743(26925) ϭ 2436 reembolsos de impuestos

134 Inferencias sobre paraacutemetrosde poblacioacuten

En el capiacutetulo 12 se vio que la recta de regresioacuten de la muestra Y ˆ ϭ a ϩ bX (ecuacioacuten 12-3) esti-maba la recta de regresioacuten de la poblacioacuten Y ϭ A ϩ BX (ecuacioacuten 12-13) La razoacuten por la cual soacute-lo podiacuteamos estimar la recta de regresioacuten de poblacioacuten y no determinarla con exactitud era que los

puntos no caen exactamente en la recta de regresioacuten de la poblacioacuten Debido a las variaciones alea-torias los puntos satisfaciacutean Y ϭ A ϩ BX ϩ e (ecuacioacuten 12-13a) maacutes que a Y ϭ A ϩ BX

En la regresioacuten muacuteltiple se tiene justo la misma situacioacuten Nuestro plano de regresioacuten estimado

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k [13-5]

es una estimacioacuten de un plano de regresioacuten de poblacioacuten verdadero pero desconocido de la forma

Plano de regresioacutende la poblacioacuten

De nuevo los puntos individuales normalmente no caen con exactitud en el plano de regresioacuten depoblacioacuten Consideremos el problema del Servicio Interno de Contribuciones para ver por queacute Notodos los pagos a informantes tendraacuten la misma efectividad Algunas horas en computadora podriacuteanutilizarse para recolectar y organizar datos otras para analizar esos datos en busca de errores y frau-des El eacutexito de la computadora en descubrir impuestos no pagados puede depender de cuaacutento tiempose dedique a cada una de estas actividades Por eacutestas y otras razones algunos de los puntos se en-contraraacuten arriba del plano de regresioacuten y algunos estaraacuten abajo de eacuteste En lugar de satisfacer laecuacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

los puntos individuales satisfaraacuten la ecuacioacuten

Las variaciones alea-torias desplazan lospuntos del plano deregresioacuten

Ecuacioacuten de regresioacuten de la poblacioacuten

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k [13-7]

Plano de regresioacuten de la poblacioacuten maacutes la variacioacuten aleatoria

Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e [13-7a]

La cantidad e que aparece en la ecuacioacuten 13-7a es una variacioacuten aleatoria que en promedio es iguala cero La desviacioacuten estaacutendar de las variaciones individuales e y el error estaacutendar de la estima-cioacuten se que estudiamos en la seccioacuten anterior es una estimacioacuten de e

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1956

Como nuestro plano de regresioacuten de la muestra Y ˆ ϭ a ϩ b1X1 ϩ b2 X 2 ϩ ϩ bk X k (ecuaci13-7) estima el plano de regresioacuten de poblacioacuten desconocido Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk

(ecuacioacuten 13-7) deberemos ser capaces de usarlo para hacer inferencias sobre el plano de regreside la poblacioacuten En esta seccioacuten haremos inferencias acerca de las pendientes ( B1 B2 Bk ) deecuacioacuten de regresioacuten ldquoverdaderardquo (la que se aplica a la poblacioacuten completa) basadas en las pendietes (b1 b2 bk ) de la ecuacioacuten de regresioacuten estimada a partir de la muestra de datos

Inferencias acerca de una pendiente individual B i El plano de regresioacuten se deriva de una muestra y no de la poblacioacuten completa Como resultado

podemos esperar que la ecuacioacuten de regresioacuten verdadera Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k que se aplica a la poblacioacuten completa) sea exactamente igual que la ecuacioacuten estimada a partir observaciones de la muestra Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k Sin embargo podemos utilizarvalor de bi una de las pendientes que calculamos a partir de la muestra para probar hipoacutetesis acca del valor de Bi una de las pendientes del plano de regresioacuten para la poblacioacuten completa

El procedimiento para probar una hipoacutetesis respecto a Bi es parecido al procedimiento analizaen los capiacutetulos 8 y 9 sobre pruebas de hipoacutetesis Para entender este proceso regresemos al probma que relaciona los impuestos no pagados descubiertos con las horas de trabajo en auditoriacuteas campo horas en computadora y recompensas a informantes En la paacutegina 729 sentildealamos que b10597 El primer paso consiste en encontrar un valor para B1 y compararlo con b1 ϭ 0597

Suponga que durante un periodo largo la pendiente de la relacioacuten entre Y y X 1 fue 0400 Paprobar si todaviacutea es vaacutelida podriacuteamos definir las hipoacutetesis como

H0 B1 ϭ 0400 larr Hipoacutetesis nula

H1 B1 0400 larr Hipoacutetesis alternativa

De hecho realizamos la prueba para saber si los datos actuales indican que B1 ha cambiado su vahistoacuterico de 0400

Para encontrar el estadiacutestico de prueba para B1 es necesario hallar primero el error estaacutendar d

coeficiente de regresioacuten El coeficiente de regresioacuten con el que estamos trabajando es b1 de moque el error estaacutendar de este coeficiente se representa con sb1

Resulta demasiado difiacutecil calcular sb1 a mano pero por fortuna Minitab calcula los errores estaacutedar de todos los coeficientes de regresioacuten Por comodidad repetimos la figura 13-2 Los errores taacutendar de los coeficientes se dan en la columna DesvEst de la salida de Minitab

En el cuadro de salida vemos que sb1

es 00811 (Similarmente si deseamos probar una hipoacutesis acerca de B2 vemos que el error estaacutendar apropiado que debemos utilizar es sb2 ϭ 00841) Uvez que encontramos sb1 en la salida de Minitab podemos usar la ecuacioacuten 13-8 para estandarizarpendiente de nuestra ecuacioacuten de regresioacuten ajustada

Estandarizacioacutendel coeficiente deregresioacuten

Error estaacutendar delcoeficientede regresioacuten

Prueba de unahipoacutetesis acerca de B i

Diferencia entre la

ecuacioacuten de regre-sioacuten verdadera y unaestimada a partir delas observacionesde la muestra

Coeficiente de regresioacuten estandarizado

t ϭ [13-8bi ndash Bi0ᎏ

sbi

donde

bull biϭ pendiente de la regresioacuten ajustada

bull Bi0 ϭ pendiente real hipoteacutetica para la poblacioacutenbull sbi ϭ error estaacutendar del coeficiente de regresioacuten

iquestPor queacute utilizamos t para denotar el estadiacutestico estandarizado Recuerde que en la regresioacuten siple utilizamos a y b en la ecuacioacuten 12-7 para calcular se y que se estimaba e la desviacioacuten estaacutedar de las variaciones de los datos (ecuacioacuten 12-13a) Entonces utilizamos se en la ecuacioacuten 12-para encontrar sb el error estaacutendar del coeficiente de regresioacuten que corresponde a la pendiente E

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2056

pezamos con n puntos y los usamos para estimar los dos coeficientes a y b Luego basamtras pruebas en la distribucioacuten t con n Ϫ 2 grados de libertad

De manera similar en la regresioacuten muacuteltiple tambieacuten empezamos con n puntos pero lospara estimar k ϩ 1 coeficientes la ordenada a y k pendientes b1 b2 bk Despueacutes estcientes se usan en la ecuacioacuten 13-6 para calcular se que de nuevo es una estimacioacuten de eviacioacuten estaacutendar de las variaciones de los datos (ecuacioacuten 13-7a) Luego se utiliza se (en ucioacuten que estaacute maacutes allaacute del alcance de este libro) para encontrar s

bi Debido a lo anterior

nuestras pruebas de hipoacutetesis en la distribucioacuten t con n Ϫ k Ϫ 1 (ϭ n Ϫ ( k ϩ l)) grados de En nuestro ejemplo el valor estandarizado del coeficiente de regresioacuten es

t ϭ

ϭ

ϭ 2432 larr Coeficiente de regresioacuten estandarizado

Suponga que estamos interesados en probar nuestras hipoacutetesis al nivel de significancia

Como tenemos 10 observaciones en la muestra y tres variables independientes sabemos n Ϫ k Ϫ 1 o 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad Buscamos en la tabla 2 del apeacutendice en lana de 10 y el rengloacuten de 6 grados de libertad Ahiacute vemos que el valor apropiado de t es 19mo nos preocupa si b1 (la pendiente del plano de regresioacuten de la muestra) es significativamferente de B1 (la pendiente hipoteacutetica del plano de regresioacuten de la poblacioacuten) eacutesta es una pdos colas y los valores criacuteticos son Ϯ1943 El coeficiente de regresioacuten estandarizado es 2se encuentra fuera de la regioacuten de aceptacioacuten de nuestra prueba de hipoacutetesis Por consiguichazamos la hipoacutetesis nula de que B1 todaviacutea es igual a 0400 En otras palabras existe unacia suficientemente grande entre b1 y 0400 para concluir que B1 ha cambiado respecto a histoacuterico Por esto sentimos que cada 100 horas adicionales de trabajo en auditoriacuteas de camaumentan la cantidad de descubrimientos de impuestos no pagados en $400000 como lo hel pasado

Ademaacutes de la prueba de hipoacutetesis podemos construir un intervalo de confianza para cude los valores de Bi Del mismo modo que bi es una estimacioacuten puntual de Bi estos intervalofianza son estimaciones de intervalo de Bi Para ilustrar el proceso de construccioacuten de interconfianza encontremos un intervalo de confianza del 95 para B3 en el ejemplo del IRS Lrelevantes son

b3 ϭ 0405 de la figura 13-2sb3 ϭ 00422

t ϭ 2447 larr Nivel de significancia del 5 y 6 grados de libertad

Intervalo deconfianza para B i

Realizacioacuten de la

prueba de hipoacutetesis

0597 ndash 0400ᎏᎏ

0081

b1 ndash B10ᎏ

sb1

Anaacute l i s i s de r e gr e s i oacutenLa ec uaci oacuten de r egr es i oacuten esDESCUBRE = - 45 0 + 0 597 AUDI TORIacute A + 1 18 COMPUTADORA + 0 405 RECOMPENSA

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 45 796 4 878 - 9 39 0 000AUDI TORIacute A 0 50697 0 08112 7 36 0 000COMPUTADORA 1 17684 0 08407 14 00 0 000RECOMPENSAS 0 40511 0 04223 9 59 0 000

s = 0 2861 R- s q = 98 3

FIGURA 13-2

Salida de Minitab(figura repetida)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2156

Con esta informacioacuten podemos calcular el intervalo de confianza de la siguiente manera

b3 ϩ t (sb3) ϭ 0405 ϩ 2447(00422)

ϭ 0508 larr Liacutemite superior

b3 Ϫ t (sb3) ϭ 0405 Ϫ 2447(00422)

ϭ 0302 larr Liacutemite inferior

Vemos que podemos tener una seguridad del 95 de que cada $1000 adicionales pagados a los formantes aumenta el descubrimiento de impuestos no pagados en una cantidad entre $302000$508000

A menudo estaremos interesados en preguntas del tipo iquesten realidad Y depende de X i Por ejeplo podriacuteamos preguntar si descubrir impuestos no pagados en realidad depende de las horas encomputadora Con frecuencia esta pregunta se plantea como iquestes X i una variable explicativa sigficativa de Y Si piensa un poco maacutes se convenceraacute de que si Bi 0 Y depende de las X i (esto esvariacutea cuando X i variacutea) y no depende de X i si Bi ϭ 0

Vemos que nuestra pregunta conduce a establecer hipoacutetesis de la forma

H0 Bi ϭ 0 larr Hipoacutetesis nula X i no es una variable explicativa significativa

H1 Bi 0 larr Hipoacutetesis alternativa X i es una variable explicativa significativa

Podemos probar estas hipoacutetesis utilizando la ecuacioacuten 13-8 del mismo modo que cuando probamnuestras hipoacutetesis acerca de si B1 todaviacutea era igual a 0400 Sin embargo existe una forma maacutes faacutede hacerlo usando la columna de la figura 13-2 de ldquocociente- t rdquo Observemos de nuevo la ecuaci13-8

t ϭ [13-

Como nuestro valor hipoteacutetico de Bi es cero el valor estandarizado del coeficiente de regresioacutedenotado por t o se convierte en

t o ϭ

El valor de t o se conoce como valor t ldquocalculadordquo Eacuteste es el nuacutemero que aparece en la columna equetada como ldquocociente-t rdquo en la figura 13-2 Denotemos por t c el valor t ldquocriacuteticordquo que buscamos

la tabla 2 del apeacutendice Entonces como la prueba para determinar si X i es una variable explicatisignificativa es una prueba de dos colas soacutelo necesitamos verificar si Ϫt c Յ t o Յ t c

Uso de valores t

calculados en lasalida de Minitab

biᎏ

sbi

bi ndash Bi0ᎏ

sbi

iquestEs significativa unavariable explicativa

Prueba para determinar si una variable es o no significativa

Ϫt c Յ t o Յ t c [13-9

donde

bull t c ϭ valor t adecuado (con n Ϫ k Ϫ 1 grados de libertad) para el nivel de significancia deprueba

bull t o ϭ bi sbi ϭ valor t observado (o calculado) obtenido con el paquete de software

Si t o

cae entre Ϫt c

y t c aceptamos H0 y llegamos a la conclusioacuten de que X

ino es una variable exp

cativa significativa En cualquier otro caso rechazamos H0 y concluimos que X i es una variable eplicativa significativa

Probemos al nivel de significancia de 001 si las horas en computadora constituyen una variabexplicativa significativa para los impuestos no pagados descubiertos De la tabla 2 del apeacutendice cn Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad y ϭ 001 vemos que t c ϭ 3707 De la figura 13tenemos que t o = 1400 Como t o Ͼ t c concluimos que el tiempo en computadora es una variab

Prueba de lasignificancia de lavariable horas decomputadora en elproblema del IRS

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2256

explicativa significativa De hecho al observar los valores t calculados para las otras dos vindependientes (tiempo de auditoriacuteas de campo t o ϭ 736 y recompensa a informantes t ovemos que tambieacuten son variables explicativas significativas

Podemos tambieacuten utilizar la columna de ldquoprdquo para probar si X i es una variable explicativacativa De hecho utilizando esa informacioacuten ni siquiera necesitamos usar la tabla 2 del aLos elementos de esta columna son los valores prob para las hipoacutetesis

H0 Biϭ 0

H1 Bi 0

Recuerde del anaacutelisis hecho en el capiacutetulo 9 que estos valores prob constituyen la probabque cada bi esteacute tan lejos de cero como (o maacutes) el valor observado obtenido de la regresioacutenverdadera Como se ilustra en la figura 13-3 solamente necesitamos comparar estos valocon el nivel de significancia de la prueba para determinar si X i es o no una variable expsignificativa para Y

Probar la significancia de una variable explicativa es siempre una prueba de dos colas Lble independiente X i es una variable explicativa significativa si bi es significativamente dife

cero es decir si t o es un nuacutemero grande positivo o negativoPara el ejemplo del IRS repetimos las pruebas con ϭ 001 Para cada una de las tres v

independientes p es menor que 001 de forma que podemos concluir que cada una de ellanificativa

Inferencias acerca de la regresioacuten como un todo

(usando una prueba F )

Suponga que cubre con papel un tablero para dardos y lanza varios dardos sobre eacutel Despueacuteberlo hecho tendraacute algo muy parecido a un diagrama de dispersioacuten Suponga entonces quuna recta de regresioacuten a este conjunto de ldquopuntos observadosrdquo y calcula r

2 Debido a que lofueron lanzados aleatoriamente usted espera obtener un valor bajo de r

2 puesto que en esten realidad no explica a Y Sin embargo si hace esto muchas veces ocasionalmente observalor alto de r

2 por pura casualidadDada cualquier regresioacuten simple (o muacuteltiple) es natural preguntarse si el valor de r2 (

realmente indica que las variables independientes explican a Y o si esto sucede por cas

A menudo esta interrogante se plantea de la siguiente manera iquestla regresioacuten como un todo ficativa En la uacuteltima seccioacuten vimos coacutemo decidir si una X i individual es una variable exp

Significancia de laregresioacuten comoun todo

FIGURA 13-3

Uso de ldquoprdquo paradeterminar si X i esuna variable expli-cativa significativa

Regioacuten de aceptacioacuten Regioacuten de aceptacioacuten

2 del aacuterea

2 del aacuterea

2 del aacuterea

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

ndasht c

ndasht o

t o

t c

0

(a) p es mayor que X

i no es una variable

explicativa significativa

(b) p es menor que X

i es una variable

explicativa significativa

ndasht o

ndasht c

t c

0

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2356

significativa ahora veremos coacutemo decidir si todas las X i tomadas en conjunto explican significavamente la variabilidad observada de Y Nuestras hipoacutetesis son

H0 B1 ϭ B2 ϭ ϭ Bk ϭ 0 larr Hipoacutetesis nula Y no depende de las X i

H1 por lo menos una Bi 0 larr Hipoacutetesis alternativa Y depende de al menos una de las X i

Cuando analizamos r 2 en el capiacutetulo 12 consideramos la variacioacuten total en Y sum(Y Ϫ Y ෆ )2 la p

te de dicha variacioacuten que explica la regresioacuten sum(Y ˆ Ϫ Y ෆ )2 y la parte no explicada de la variacioacutensum(Y Ϫ Y ˆ )2 La figura 13-4 es un duplicado de la figura 12-15 Sirve como repaso de la relacioacuten etre la desviacioacuten total la desviacioacuten explicada y la desviacioacuten no explicada para un solo dato en uregresioacuten simple Aunque no podamos dibujar una figura similar para una regresioacuten muacuteltiple coceptualmente estamos haciendo lo mismo

Al analizar la variacioacuten en Y fijamos nuestra atencioacuten en tres teacuterminos diferentes cada uno de cuales es una suma de cuadrados Los denotamos con

Suma de cuadradosy sus grados delibertad

Anaacutelisis de lavariacioacuten de losvalores Y

FIGURA 13-4

Desviacioacuten totaldesviacioacutenexplicada ydesviacioacuten noexplicada paraun valor observadode Y

Y

X

Un valor observado de lavariable dependiente (Y )

R e c t a d

e r e g r e s

i oacute n

Desviacioacuten no explicada de esta Y respectoa su media Y

(Y ndash Y )^

Desviacioacuten explicada deesta Y respecto a su media Y

(Y ndash Y )^Y

Valor estimado de esta Y

a partir de la recta de regresioacuten (Y )^

Desviacioacuten total de esta Y

respecto a su media Y

(Y ndash Y )

Tres sumas de cuadrados

SCT ϭ suma de cuadrados total (es decir la parte explicada) ϭ sum(Y Ϫ Y ෆ )2

SCR ϭ suma de cuadrados de la regresioacuten (es decir la parte explicada) ϭ sum(Y ˆ Ϫ Y ෆ )2 [13-10

SCE ϭ suma de cuadrados del error (es decir la parte no explicada) ϭ sum(Y Ϫ Y ˆ )2

Estaacuten relacionadas por la ecuacioacuten

que dice que la variacioacuten total en Y puede dividirse en dos partes la parte explicada y la no explicaCada una de estas sumas de cuadrados tiene un nuacutemero asociado de grados de libertad SCT t

ne n Ϫ 1 grados de libertad (n observaciones menos un grado de libertad debido a que la media la muestra estaacute fija) SCR tiene k grados de libertad porque existen k variables independientes qse utilizaron para explicar Y Finalmente SCE tiene n Ϫ k Ϫ 1 grados de libertad porque utilizamnuestras n observaciones para estimar k ϩ 1 constantes a b1 b2 bk Si la hipoacutetesis nula es ci

ta el cociente

Descomposicioacuten de la variacioacuten total de Y

SCT ϭ SCR ϩ SCE [13-1

Cociente F

F ϭ [13-12SCR k ᎏᎏ

SCE(n ndash k ndash 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2456

tiene una distribucioacuten F con k grados de libertad en el numerador y n Ϫ k Ϫ 1 grados de libel denominador Si la hipoacutetesis nula es falsa entonces el cociente tiende a ser maacutes grande qula hipoacutetesis nula es verdadera De modo que si el cociente F es demasiado grande (seguacuten lo na el nivel de significancia de la prueba y el valor apropiado de la tabla 6 del apeacutendice) rechH0 y concluimos que la regresioacuten como un todo es significativa

La figura 13-5 presenta la salida de Minitab para el problema del IRS Esta parte del rincluye los cocientes F calculados para la regresioacuten en ocasiones llamado anaacutelisis de v

(ANOVA) para la regresioacuten Probablemente se pregunte si esto tiene algo que ver con el anaacutelisrianza que estudiamos en el capiacutetulo 11 La respuesta es siacute Aunque no lo hicimos es posibletrar que el anaacutelisis de varianza visto en el capiacutetulo 11 tambieacuten contempla la variacioacuten total las observaciones alrededor de la gran media y la divide en dos partes una explicada por lascias entre los distintos grupos (que corresponde a lo que llamamos varianza entre columnas)

no explicada por dichas diferencias (que corresponde a la varianza dentro de columnas) Estcisamente anaacutelogo a lo que acabamos de hacer en la ecuacioacuten 13-11Para el problema del IRS vemos que SCR ϭ 29109 (con k ϭ 3 grados de libertad) SCE

(con n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad) y que

F ϭ ϭ ϭ 11833

Los elementos en la columna ldquoMCrdquo son justo las sumas de cuadrados divididas entre sus glibertad Para 3 grados de libertad en el numerador y 6 en el denominador la tabla 6 del apeacutence que 978 es el liacutemite superior de la regioacuten de aceptacioacuten para un nivel de significancia El valor calculado de F 11833 estaacute muy por arriba de 978 de manera que se ve que la r

como un todo es altamente significativa Se puede llegar a la misma conclusioacuten si se observresultado del programa dice que ldquo prdquo es 0000 Debido a que este valor prob es menor que elsignificancia ϭ 001 se concluye que la regresioacuten completa es significativa De esta mapuede usar la p de ANOVA como prueba sin tener que utilizar la tabla 6 del apeacutendice para bvalor criacutetico de F Esto es anaacutelogo a la manera en que se usaron los valores de p en la figura ra probar la significancia de las variables explicativas individuales

Multicolinealidad en la regresioacuten muacuteltiple

En el anaacutelisis de regresioacuten muacuteltiple los coeficientes de regresioacuten a menudo se vuelven

confiables conforme aumenta el grado de correlacioacuten entre las variables independie

existe un alto nivel de correlacioacuten entre algunas de las variables independientes nos enfrenun problema que los estadiacutesticos llaman multicolinealidad

La multicolinealidad puede presentarse si deseamos estimar la recuperacioacuten de las ventaempresa y utilizamos tanto el nuacutemero de vendedores empleados como sus salarios totales Cvalores asociados con estas dos variables independientes tienen una correlacioacuten alta neceusar soacutelo un conjunto de ellos para realizar nuestra estimacioacuten De hecho al agregar una segriable que estaacute correlacionada con la primera se distorsionan los valores de los coeficientgresioacuten Sin embargo a menudo podemos predecir bien Y incluso cuando haya multicoline

Consideremos un ejemplo donde existe multicolinealidad para ver coacutemo afecta a la regresrante los 12 meses pasados el gerente del restaurante Pizza Shack ha estado poniendo unaanuncios en el perioacutedico local Los anuncios se programan y pagan el mes anterior a que ap

Un ejemplo demulticolinealidad

Definicioacuten y efecto dela multicolinealidad

9703ᎏ

0082

29109 3ᎏ

0491 6Prueba de lasignificancia de laregresioacuten en elproblema del Serviciode Contribuciones

Anaacutelisis devarianza parala regresioacuten

Prueba F de laregresioacuten como

un todo

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 29 1088 9 7029 118 52 0Er r or 6 0 4912 0 0819Tot al 9 29 6000

FIGURA 13-5Salida de Minitabanaacutelisis devarianza

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2556

Cada anuncio contiene un cupoacuten que permite llevarse dos pizzas pagando solamente la de mcio El gerente recolectoacute los datos de la tabla 13-4 y le gustariacutea utilizarlos para predecir las vpizzas

En las figuras 13-6 y 13-7 se dieron los resultados de Minitab para las regresiones respelas ventas totales sobre el nuacutemero de anuncios y sobre el costo

Para la regresioacuten sobre el nuacutemero de anuncios tenemos que el valor t observado es 395grados de libertad y un nivel de significancia de ϭ 001 se encontroacute que el valor t criacuteticdo de la tabla 2 del apeacutendice) es 3169 Como t o Ͼ t c (o de manera equivalente como p es m001) concluimos que el nuacutemero de anuncios es una variable explicativa altamente signifilas ventas totales Note tambieacuten que r 2 ϭ 610 de modo que el nuacutemero de anuncios explximadamente el 61 de la variacioacuten en las ventas de pizzas

Para la regresioacuten sobre el costo de los anuncios el valor t observado es 454 de modo qude los anuncios es una variable explicativa de las ventas totales todaviacutea maacutes significativa que ro de anuncios (para los que el valor t observado fue soacutelo 395) En esta regresioacuten r 2 ϭ 673

el costo de los anuncios explica aproximadamente el 67 de la variacioacuten de las ventas de pizComo ambas variables explicativas son altamente significativas por siacute mismas intentam

zar ambas en una regresioacuten muacuteltiple El resultado se presenta en la figura 13-8La regresioacuten muacuteltiple es altamente significativa como un todo ya que la p de ANOVA e

Uso de ambas varia-bles explicativas enuna regresioacuten muacuteltiple

Dos regresionessimples

Datos de ventas y anun-cios para el restaurantePizza Shack

Tabla 13-4 X 1 X 2 Y

Nuacutemero Costo de anuncios Venta tode anuncios publicados de pizz

Mes publicados (cientos de doacutelares) (miles de d

Mayo 12 139 436

Junio 11 120 380

Julio 9 93 301

Agosto 7 97 353

Septiembre 12 123 464

Octubre 8 114 342

Noviembre 6 93 302

Diciembre 13 143 407

Enero 8 102 385

Febrero 6 84 226

Marzo 8 112 376

Abril 10 111 352

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esVENTAS = 16 9 + 2 08 ANUNCI OS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 16 937 4 982 3 40 0 007ANUNCI OS 2 0832 0 5271 3 95 0 003

s = 4 206 R- s q = 61 0

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 1 276 31 276 31 15 62 Er r or 10 176 88 17 69Tot a l 11 453 19

Figura 13-6

Regresioacuten de lasventas sobre elnuacutemero deanuncios conMinitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2656

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2756

gar el nuacutemero de anuncios como segunda variable explicativa ademaacutes del costo de los anuncios eplica nada maacutes alrededor del 1 adicional de la variacioacuten de las ventas totales

En este punto es justo preguntarse iquestqueacute variable realmente explica la variacioacuten de las ventotales en la regresioacuten muacuteltiple La respuesta es que ambas la explican pero no podemos separ

sus contribuciones individuales debido a que estaacuten altamente correlacionadas entre siacute E

consecuencia sus coeficientes en la regresioacuten muacuteltiple tienen errores estaacutendar altos valore

calculados relativamente bajos y valores prob Ͼ | t | relativamente altos

iquestDe queacute manera nos afecta esta multicolinealidad Todaviacutea podemos hacer predicciones relativmente precisas cuando se encuentra presente note que para la regresioacuten muacuteltiple (la salida se dala figura 13-8) el error estaacutendar de la estimacioacuten que determina el ancho de los intervalos de co

fianza para las predicciones es 3989 mientras que para la regresioacuten simple con el costo de los anucios como variable explicativa (salida en la figura 13-7) tenemos se ϭ 3849 Lo que no podemhacer es predecir con mucha precisioacuten coacutemo cambiaraacuten las ventas si aumentamos en uno el nuacutemede anuncios La regresioacuten muacuteltiple dice que b1 ϭ 0625 (esto es cada anuncio aumenta las ventotales de pizzas alrededor de $625) pero el error estaacutendar de este coeficiente es 112 (es decir apximadamente $1120)

Las contribucionesindividuales nopueden separarse

Ejercicios 134

Ejercicios de autoevaluacioacuten

EA 13-4 Edith Pratt es una ocupada ejecutiva de una compantildeiacutea de transporte de carga a nivel nacional y va tara una junta porque no encuentra la salida de la regresioacuten muacuteltiple elaborada por un asistente Si la regsioacuten total es significativa al nivel 005 ella desea usar las salida de computadora como evidencia para fudamentar algunas ideas que expondraacute en la reunioacuten Sin embargo su ayudante estaacute enfermo De hectoda la informacioacuten que tiene de la regresioacuten muacuteltiple es un trozo de papel con los siguientes datos

Regresioacuten paraEdith Pratt

SCR 8724 con gl

SCE con 17 gl

SCT 10236 con 24 gl

Como el papel ni siquiera tiene todos los nuacutemeros Edith ha concluido que no es uacutetil Usted sin embardebe saber maacutes que ella iquestPuede Edith entrar en la junta o debe seguir buscando la salida de computador

EA 13-5 Una pequentildea liacutenea aeacuterea de Nueva Inglaterra realizoacute una encuesta sobre sus 15 terminales y obtuvo losguientes datos para el mes de febrero donde

VENTAS ϭ ingreso total seguacuten el nuacutemero de boletos vendidos (en miles de doacutelares)

PROMOCϭ cantidad gastada en promociones de la liacutenea aeacuterea en el aacuterea (en miles de doacutelares)

COMPET ϭ nuacutemero de liacuteneas aeacutereas que compiten en esa terminal

GRATIS ϭ nuacutemero de pasajeros que vuelan gratis (por diferentes razones)

Sugerencia el concepto de hacer infe-rencias respecto a una regresioacuten muacutelti-ple es justo lo mismo que se hizo en elcapiacutetulo 12 cuando hicimos inferencias

respecto a una recta de regresioacuten excepto que ahora se em-

plean dos o maacutes variables independientes Advertencia lamulticolinealidad es un problema que debe manejarse enla regresioacuten muacuteltiple y es necesario desarrollar una com-prensioacuten con sentido comuacuten Recuerde que todaviacutea puedehacer predicciones precisas cuando estaacute presente Pero re-cuerde tambieacuten que no puede decir con mucha precisioacuten

cuaacutento cambiaraacute la variable dependiente si ldquomanipulardquo lavariables independientes Entonces el objetivo debe seminimizar la multicolinealidad Sugerencia la mejor regresioacuten muacuteltiple es la que explica la relacioacuten entre los datos asentildealar la responsabilidad de la mayor proporcioacuten de la va

riacioacuten en la variable dependiente con el menor nuacutemero dvariables independientes Advertencia no es una buenidea incluir demasiadas variables independientes soacutelo porque cuenta con una computadora y un paquete de softwarpara estadiacutestica

SUGERENCIAS

Y

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2856

Ventas (doacutelares) Promoc (doacutelares) Compet Gratis

793 25 10 3

2001 55 8 6

1632 60 12 9

2001 79 7 16

1460 52 8 15

1777 76 12 9

309 20 12 8

2919 90 5 10

1600 40 8 43394 96 5 16

1596 55 11 7

863 30 12 6

2375 60 6 10

1072 50 10 4

1550 35 10 4

a) Utilice la siguiente salida de Minitab para determinar la ecuacioacuten de regresioacuten que mejor se ara la liacutenea aeacuterea

La ec uaci oacuten de r egr es i oacuten esVENTAS ϭ 172 ϩ 25 9 PROMOVϪ 13 2 COMPET Ϫ 3 04 GRATI S

Pr onos t i cador Coef Des vEs t Coci ent e - t Cons t ant e 172 34 51 38 3 35 0PROMOV 25 950 4 877 5 32 0COMPET - 13 238 3 686 - 3 59 0GRATI S - 3 041 2 342 - 1 30 0

b) iquestLos pasajeros que vuelan gratis ocasionan una disminucioacuten significativa en las ventas Fpruebe las hipoacutetesis apropiadas Use ϭ 005

c) iquestUn incremento de $1000 en las promociones cambia las ventas en $28000 o el cambio ecativamente diferente de $28000 Formule y pruebe las hipoacutetesis adecuadas Use ϭ 010

d) Calcule un intervalo de confianza del 90 para el coeficiente de la pendiente de la COMPET

Aplicaciones

13-22 Mark Lowtown publica el perioacutedico Mosquito Junction Enquirer y tiene problemas para predectidad de papel perioacutedico que necesita imprimir diariamente Eligioacute aleatoriamente 27 diacuteas del arior y registroacute la siguiente informacioacuten

PESO ϭ peso en libras de papel perioacutedico para la edicioacuten de ese diacutea

CLASIFICADOS ϭ nuacutemero de anuncios clasificados

PUBLICIDAD ϭ nuacutemero de anuncios publicitarios

PLANA COMPLETA ϭ nuacutemero de anuncios a una plana

Utilizando Minitab para hacer una regresioacuten de PESO sobre las otras tres variables Mark obtuguiente salida

Pr onos t i cador Coef Des vEs t Coci ent e- t Cons t ant e 1072 95 872 43 1 23 0CLASI FI CADOS 0 251 0 126 1 99 0PUBLI CI DAD 1 250 0 884 1 41 0PLANA COMPLETA 250 66 67 92 3 69 0

a) Mark siempre ha pensado que cada anuncio publicitario utiliza al menos 3 libras de papel iquestsioacuten le da una razoacuten significativa para dudar esto al nivel del 5

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2956

b) De manera similar Mark siempre ha creiacutedo que cada anuncio clasificado utiliza aproximmedia libra de papel iquestTiene ahora Mark una razoacuten significativa para dudar esto al nivel del

c) Mark vende espacios de anuncios de plana completa a los comerciantes locales a $30 la paacutegberaacute pensar en ajustar sus tarifas si el papel perioacutedico le cuesta $009 por libra Suponga costos son despreciables Establezca expliacutecitamente las hipoacutetesis y una conclusioacuten (Sugere

jando todo lo demaacutes constante cada anuncio adicional de plana completa tiene un costo de bras de papel ϫ $009 por libra ϭ $2256 El punto de equilibrio es 333333 libras iquestPor quel coeficiente de pendiente para PLANA COMPLETA es significativamente mayor que Mark no estaacute obteniendo ganancias y debe cambiar sus tarifas)

13-23 Para los datos del ejercicio 13-18 y un nivel de significancia de 010 iquestcuaacuteles variables son sign

mente explicativas de los resultados de los exaacutemenes (Habiacutea 12 estudiantes en la muestra) 13-24 Para los datos del ejercicio 13-18 y la siguiente salida de Minitab del procedimiento de regresiple hecho por Bill

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 3134 42 783 60Er r or 7 951 25 135 89Tot a l 11 4085 67

a) iquestCuaacutel es el valor observado de F b) A un nivel de significancia de 005 iquestcuaacutel es el valor criacutetico de F que se debe utilizar para d

si la regresioacuten como un todo es significativac) Basaacutendose en las respuestas a los incisos a) y b) iquestes la regresioacuten significativa como un tod

13-25 Remiacutetase al ejercicio 13-19 A un nivel de significancia de 001 iquestes la variable DISTANCIA uble explicativa significativa para VENTAS

13-26 Para los datos del ejercicio 13-19 y la siguiente salida adicional de Minitab al correr la regresioacuten

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 2861495 715374 102 39 0Er r or 18 125761 6896 7Tot a l 22 2987256

Al nivel de significancia de 005 iquestes la regresioacuten significativa como un todo

13-27 Henry Lander es el director de produccioacuten de la Alecos Corporation de Caracas Venezuela Hede que le ayude a determinar una foacutermula para predecir el ausentismo de los empacadores de chipoacutetesis es que la temperatura diaria promedio puede explicar el porcentaje de ausentismo Durios meses reuacutene datos ejecuta el procedimiento de regresioacuten simple y encuentra que la tempeplica 66 de la variacioacuten en el ausentismo Pero Henry no estaacute convencido de que eacuteste sea un cador satisfactorio Sugiere que la precipitacioacuten pluvial diaria podriacutea tambieacuten tener algo que vausentismo de modo que registra los datos correspondientes y hace una regresioacuten del ausentismte el tiempo de lluvias y obtiene un valor R2 de 059 ldquoiexclEurekardquo grita usted ldquoiexclLo tengo Con uticador que explica 66 y otro que explica 59 todo lo que tengo que hacer es una regresioacutenutilizando ambos y seguramente tendreacute un pronosticador casi perfectordquo Para su desaacutenimo sin la regresioacuten muacuteltiple tiene una R

2 de soacutelo 68 que es solamente un poco mejor que la variablperatura sola iquestCoacutemo puede explicar esta aparente discrepancia

13-28 Juan Armenlegg administrador de Rockyrsquos Diamond y Jewelry Store estaacute interesado en desamodelo para estimar la demanda del consumidor para su costosa mercanciacutea Como la mayoriacutea de

tes compran diamantes y joyas a creacutedito Juan estaacute seguro de que dos factores que deben influirmanda de los clientes son la tasa real de inflacioacuten anual y la tasa real de intereses sobre preacutestamprincipales bancos del paiacutes Explique algunos problemas que Juan podriacutea encontrar si fuera a dun modelo de regresioacuten basado en estas dos variables de prediccioacuten

13-29 Un nuevo programa de juegos Check That Model pide a los concursantes que especifiquen el nuacutenimo de paraacutemetros que necesitan para determinar si un modelo de regresioacuten muacuteltiple es signifimo un todo para ϭ 001 Usted ganoacute la apuesta con 4 paraacutemetros Use la siguiente informacioacutenterminar si la regresioacuten es significativa

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3056

R 2

ϭ 07452

SCE ϭ 1254

n ϭ 18

Nuacutemero de variables independientes ϭ 3

13-30 La Scottish Turist Agency estaacute interesada en el nuacutemero de turistas que entran al paiacutes cada semanrante la temporada alta Se recolectaron los siguientes datos

Turistas (Y ) ϭ nuacutemero de turistas que entran a Escocia en una semana (en miles)

Cambio (X 1)ϭ nuacutemero de libras escocesas compradas por $1 doacutelar

Precio (X 2) ϭ nuacutemero de libras escocesas cobradas por viaje redondo en camioacuten de Londres a Edimburgo

Promoc (X 3) ϭ cantidad gastada en promocioacuten del paiacutes (en miles de libras escocesas)Temp (X 4) ϭ temperatura media durante la semana en Edimburgo (en grados Celsius)

Turistas (Y ) Cambio (X 1) Precio (X 2) Promoc (X 3) Temp (X 4)

69 061 40 87 154

71 059 40 88 156

68 063 40 85 154

79 061 35 86 153

76 060 35 94 158

82 065 35 99 162

80 058 35 98 164

84 059 35 102 166

97 061 30 114 174

98 062 30 116 172

72 057 40 84 176

67 055 40 86 164

a) Utilice el paquete de software que tenga para determinar la ecuacioacuten de regresioacuten que mejote a los datos de la agencia de turismo

b) iquestEs la tasa de cambio una variable explicativa significativa Establezca y pruebe las hipoacutetesidas a un nivel de significancia de 010

c) Un incremento de 1000 libras en las promociones iquestaumenta el nuacutemero de turistas en maacutesEstablezca y pruebe las hipoacutetesis adecuadas para un nivel de significancia de 005

d) Calcule un intervalo de confianza del 95 para el coeficiente de la pendiente de Temp

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-4 Como SCT ϭ SCR ϩ SCE SCE ϭ SCT Ϫ SCR ϭ 10236 Ϫ 8724 ϭ 1512Como gl SCT ϭ gl SCR ϩ gl SCE gl SCR ϭ gl SCT Ϫ gl SCE ϭ 24 Ϫ 17 ϭ 7

Entonces F ϭ ϭ ϭ 1401

F CRiacuteT ϭ F (7 17 005) ϭ 261Como F OBS gt F CRIacuteT se concluye que la regresioacuten es significativa como un todo Edith debe conticando la salida de computadora de la regresioacuten para usarla en la junta

EA 13-5 De la salida de computadora se obti enen los siguientes resultadosa) VENTAS ϭ 17234 ϩ 25950PROMOC Ϫ13238COMPET Ϫ 3041GRATISb) H0 BGRATIS ϭ 0 H1 BGRATIS Ͻ 0 ϭ 005

Eacutesta es una prueba de una cola y el valor prob en los resultados es para la alternativa de dos c BGRATIS 0 De manera que para esta prueba el valor prob es 02212 ϭ 0111 Ͼ ϭ 00que no se puede rechazar H0 las ventas no disminuyen significativamente cuando aumenta ro de pasajeros que vuelan gratis

c) H0 BPROMOC ϭ 28 H1 BPROMOC 28 ϭ 010

87247ᎏᎏ

151217SCRk ᎏᎏ

SCE(n Ϫ k Ϫ 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3156

El valor observado t de los resultados de regresioacuten es

ϭ ϭ Ϫ0420

Con 11 grados de libertad y ϭ 010 en ambas colas combinadas los valores criacuteticos t parba son Ϯ1796 asiacute el valor observado estaacute dentro de la regioacuten de aceptacioacuten No se rechacambio en VENTAS para un incremento de una unidad ($1000) en PROMOC no es significate diferente de 28 ($28000)

d) Con 11 grados de libertad el valor t para un intervalo del 90 de confianza es 1796 por lo

tervalo esbCOMP Ϯ 1796sbCOMP

ϭ Ϫ13238 Ϯ 1796(3686)

ϭ Ϫ13238 Ϯ 6620 ϭ (Ϫ19858 Ϫ 6618)

La liacutenea aeacuterea puede tener una seguridad del 90 de que el ingreso por los boletos en una ofminuye entre $6600 y $19900 aproximadamente con cada liacutenea aeacuterea adicional que comp

135 Teacutecnicas de modelado

Dada una variable que deseamos explicar y un conjunto de variables explicativas potencialehaya varias ecuaciones de regresioacuten diferentes que podamos estudiar dependiendo de queacute explicativas incluyamos y de coacutemo lo hagamos Cada una de esas ecuaciones de regresioacutence como modelo Las teacutecnicas de modelado son las distintas formas en que podemos incluriables explicativas y verificar queacute tan apropiados son los modelos de regresioacuten Existen municas de modelado diferentes pero soacutelo veremos dos de las maacutes utilizadas

Datos cualitativos y variables ficticias

En todos los ejemplos de regresioacuten que hemos visto hasta ahora los datos manejados hanmeacutericos o cuantitativos Pero ocasionalmente nos enfrentaremos con una variable categoacuterilitativa En el problema del inicio el capiacutetulo el director de personal desea ver si el salarioun vendedor depende de su sexo En la tabla 13-5 repetimos los datos de dicho problema

Por el momento ignore la antiguumledad y utilice la teacutecnica desarrollada en el capiacutetulo 9 bar la diferencia entre las medias de dos poblaciones para ver si los hombres ganan maacutes qu

jeres Pruebe con ϭ 001 Si tomamos a los hombres como la poblacioacuten 1 y a las mujerespoblacioacuten 2 probaremos las siguientes hipoacutetesis

H0 1 ϭ 2 larr Hipoacutetesis nula no existe discriminacioacuten por sexo en los salarios base

H1 1 Ͼ 2 larr Hipoacutetesis alternativa se discrimina a las mujeres en su salario base

ϭ 001 larr Nivel de significancia

Revisioacuten del enfoqueanterior del problema

Buacutesqueda dediferentes modelos

25950 Ϫ 28ᎏᎏ

4877

(bPROMOC Ϫ 28)ᎏᎏ

sbPROMOC

Datos para el problemade discriminacioacuten porsexo

Tabla 13-5 Vendedores VendedorasAntiguumledad Salario base Antiguumledad Salario base(en meses) (en miles) (en meses) (en miles)

6 75 5 62

10 86 13 87

12 91 15 94

18 103 21 98

30 130

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3256

A continuacioacuten bosquejamos el anaacutelisis Si tiene problemas para seguirlo deberaacute repasamente la seccioacuten 93

n1 ϭ 5 n2 ϭ 4

x ෆ1 ϭ 97 x ෆ2 ϭ 8525

s2

1 ϭ 4415 s2

2 ϭ 2609

s2

p ϭ

ϭ

ϭ 3641

x ෆ1Ϫ x

ෆ2ϭ s pΊ ϩ

ϭ 128

t ϭ

ϭ

ϭ 092

Con siete grados de libertad el valor t criacutetico para una prueba de cola superior con ϭ 001 eComo el valor t observado de 092 es menor que 2998 no podemos rechazar H0

Entonces el anaacutelisis concluye que no parece haber discriminacioacuten por sexo en los salarPero recuerde que hasta ahora se han ignorado los datos de antiguumledad laboral para el anaacuteli

Antes de seguir vea el diagrama de dispersioacuten de los datos En la figura 13-9 los punto

corresponden a los hombres y los blancos a las mujeres El diagrama de dispersioacuten muestraridad que el salario base aumenta con los antildeos de antiguumledad pero si con la mirada sigue lo qla recta de regresioacuten notaraacute que los puntos negros tienden a estar arriba de ella y los blancos

La figura 13-10 da la salida de una regresioacuten del salario base sobre los meses de antiguumlelos resultados se ve que la antiguumledad es una variable explicativa altamente significativa

Ademaacutes r 2

ϭ 926 que indica que la variable meses de antiguumledad explica cerca del 9variacioacuten en el salario base La figura 13-11 contiene parte de la salida que no se vio antesbla de residuos Para cada punto el residuo es simplemente Y Ϫ Y ˆ que se reconoce como el

Una ldquomiradardquo a los

datos

El enfoque anterior nodetecta discriminacioacuten

(97 ndash 8525) ndash 0ᎏᎏ

128

( x ෆ1 ndash x ෆ2) ndash (1 Ϫ 2)H0

ᎏᎏᎏ

ˆ x ෆ1Ϫ

x ෆ2

1ᎏ

n2

1ᎏ

n1

4(4415) ϩ 3(2609)ᎏᎏᎏ5 ϩ 4 ndash 2

(n1 ndash 1)s21 ϩ (n2 ndash 1)s22ᎏᎏᎏ

n1 ϩ n2 ndash 2

FIGURA 13-9

Diagrama de dis-persioacuten de salariosbase contra mesesde antiguumledad

4 8 12 16 20 24 28

4

8

12

Meses de antiguumledad

S a l a r i o ( m i l e s d e d oacute l a r e s )

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3356

el ajuste de la recta de regresioacuten en ese punto En la figura 13-11 AJUST1 son los valores y RESI1 son los residuos

Tal vez la parte maacutes importante del anaacutelisis del resultado de una regresioacuten sea estusiduos Si la regresioacuten incluye todos los factores explicativos relevantes estos residuo

ser aleatorios Dicho de otro modo si los residuos muestran cualquier patroacuten no aleat

to indica que hay algo sistemaacutetico que afecta el proceso y que no hemos tomado en cu

manera que buscamos patrones en los residuos o para decirlo de forma maacutes pintoresca ldquopmos a los residuos hasta hacerlos hablarrdquo

Si observamos los residuos presentados en la figura 13-11 vemos que los primeros cincoson positivos De modo que para los vendedores tenemos Y ndash Y ˆ Ͼ 0 o Y Ͼ Y ˆ es decir laregresioacuten cae abajo de estos cinco puntos Tres de los cuatro uacuteltimos residuos son negaticonsiguiente para las vendedoras tenemos Y Ϫ Y ˆ Ͻ 0 o Y Ͻ Y ˆ asiacute que la recta de regresicuentra arriba de tres de los cuatro puntos Esto confirma lo que vimos al observar el diagdispersioacuten de la figura 13-9 Este patroacuten no aleatorio en los residuos sugiere que el sexo siacute etor determinante del salario base

iquestCoacutemo podemos incorporar el sexo de los vendedores dentro del modelo de regresioacutencemos utilizando un dispositivo llamado variable ficticia (o variable indicadora) Para lpuntos que representan a los vendedores esta variable tiene valor de 0 y para los cuatro purepresentan a las vendedoras valdraacute 1 Los datos de entrada para nuestra regresioacuten con variticias se dan en la tabla 13-6

Para los datos de la tabla 13-6 se ajusta una regresioacuten de la forma

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

Uso de variablesficticias

Deteccioacuten depatrones en losresiduos

ldquoPresionar a losresiduosrdquo

Anaacutel i s i s de r e gr e s i oacuten

La ec uac i oacuten de r e gr es i oacuten esSALARI O ϭ 5 81 ϩ 0 233 MESES

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t pCons t a nt e 5 8093 0 4038 14 39 0 000MESES 0 23320 0 02492 9 36 0 000

s ϭ 0 5494 R- s q ϭ 92 6

Anaacute l i s i s de va r i a nz aFUENTE GL SC MC F Re gr e s i oacuten 1 26 443 24 443 87 61 0Er r or 7 2 113 0 302Tot a l 8 28 556

FIGURA 13-10

Regresioacuten conMinitab del salariobase sobre losmeses deantiguumledad

RENGLOacuteN SALARI O AJ UST1 RESI 1

1 7 5 7 2085 0 2914992 8 6 8 1413 0 458684

3 9 1 8 6077 0 4922764 10 3 10 0069 0 2930545 13 0 12 8054 0 1946076 6 2 6 9753 - 0 7752977 8 7 8 8409 - 0 1409288 9 4 9 3073 0 0926649 9 8 10 7066 - 0 906558

FIGURA 13-11

Tabla de residuosde Minitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 1956

Como nuestro plano de regresioacuten de la muestra Y ˆ ϭ a ϩ b1X1 ϩ b2 X 2 ϩ ϩ bk X k (ecuaci13-7) estima el plano de regresioacuten de poblacioacuten desconocido Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk

(ecuacioacuten 13-7) deberemos ser capaces de usarlo para hacer inferencias sobre el plano de regreside la poblacioacuten En esta seccioacuten haremos inferencias acerca de las pendientes ( B1 B2 Bk ) deecuacioacuten de regresioacuten ldquoverdaderardquo (la que se aplica a la poblacioacuten completa) basadas en las pendietes (b1 b2 bk ) de la ecuacioacuten de regresioacuten estimada a partir de la muestra de datos

Inferencias acerca de una pendiente individual B i El plano de regresioacuten se deriva de una muestra y no de la poblacioacuten completa Como resultado

podemos esperar que la ecuacioacuten de regresioacuten verdadera Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k que se aplica a la poblacioacuten completa) sea exactamente igual que la ecuacioacuten estimada a partir observaciones de la muestra Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k Sin embargo podemos utilizarvalor de bi una de las pendientes que calculamos a partir de la muestra para probar hipoacutetesis acca del valor de Bi una de las pendientes del plano de regresioacuten para la poblacioacuten completa

El procedimiento para probar una hipoacutetesis respecto a Bi es parecido al procedimiento analizaen los capiacutetulos 8 y 9 sobre pruebas de hipoacutetesis Para entender este proceso regresemos al probma que relaciona los impuestos no pagados descubiertos con las horas de trabajo en auditoriacuteas campo horas en computadora y recompensas a informantes En la paacutegina 729 sentildealamos que b10597 El primer paso consiste en encontrar un valor para B1 y compararlo con b1 ϭ 0597

Suponga que durante un periodo largo la pendiente de la relacioacuten entre Y y X 1 fue 0400 Paprobar si todaviacutea es vaacutelida podriacuteamos definir las hipoacutetesis como

H0 B1 ϭ 0400 larr Hipoacutetesis nula

H1 B1 0400 larr Hipoacutetesis alternativa

De hecho realizamos la prueba para saber si los datos actuales indican que B1 ha cambiado su vahistoacuterico de 0400

Para encontrar el estadiacutestico de prueba para B1 es necesario hallar primero el error estaacutendar d

coeficiente de regresioacuten El coeficiente de regresioacuten con el que estamos trabajando es b1 de moque el error estaacutendar de este coeficiente se representa con sb1

Resulta demasiado difiacutecil calcular sb1 a mano pero por fortuna Minitab calcula los errores estaacutedar de todos los coeficientes de regresioacuten Por comodidad repetimos la figura 13-2 Los errores taacutendar de los coeficientes se dan en la columna DesvEst de la salida de Minitab

En el cuadro de salida vemos que sb1

es 00811 (Similarmente si deseamos probar una hipoacutesis acerca de B2 vemos que el error estaacutendar apropiado que debemos utilizar es sb2 ϭ 00841) Uvez que encontramos sb1 en la salida de Minitab podemos usar la ecuacioacuten 13-8 para estandarizarpendiente de nuestra ecuacioacuten de regresioacuten ajustada

Estandarizacioacutendel coeficiente deregresioacuten

Error estaacutendar delcoeficientede regresioacuten

Prueba de unahipoacutetesis acerca de B i

Diferencia entre la

ecuacioacuten de regre-sioacuten verdadera y unaestimada a partir delas observacionesde la muestra

Coeficiente de regresioacuten estandarizado

t ϭ [13-8bi ndash Bi0ᎏ

sbi

donde

bull biϭ pendiente de la regresioacuten ajustada

bull Bi0 ϭ pendiente real hipoteacutetica para la poblacioacutenbull sbi ϭ error estaacutendar del coeficiente de regresioacuten

iquestPor queacute utilizamos t para denotar el estadiacutestico estandarizado Recuerde que en la regresioacuten siple utilizamos a y b en la ecuacioacuten 12-7 para calcular se y que se estimaba e la desviacioacuten estaacutedar de las variaciones de los datos (ecuacioacuten 12-13a) Entonces utilizamos se en la ecuacioacuten 12-para encontrar sb el error estaacutendar del coeficiente de regresioacuten que corresponde a la pendiente E

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2056

pezamos con n puntos y los usamos para estimar los dos coeficientes a y b Luego basamtras pruebas en la distribucioacuten t con n Ϫ 2 grados de libertad

De manera similar en la regresioacuten muacuteltiple tambieacuten empezamos con n puntos pero lospara estimar k ϩ 1 coeficientes la ordenada a y k pendientes b1 b2 bk Despueacutes estcientes se usan en la ecuacioacuten 13-6 para calcular se que de nuevo es una estimacioacuten de eviacioacuten estaacutendar de las variaciones de los datos (ecuacioacuten 13-7a) Luego se utiliza se (en ucioacuten que estaacute maacutes allaacute del alcance de este libro) para encontrar s

bi Debido a lo anterior

nuestras pruebas de hipoacutetesis en la distribucioacuten t con n Ϫ k Ϫ 1 (ϭ n Ϫ ( k ϩ l)) grados de En nuestro ejemplo el valor estandarizado del coeficiente de regresioacuten es

t ϭ

ϭ

ϭ 2432 larr Coeficiente de regresioacuten estandarizado

Suponga que estamos interesados en probar nuestras hipoacutetesis al nivel de significancia

Como tenemos 10 observaciones en la muestra y tres variables independientes sabemos n Ϫ k Ϫ 1 o 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad Buscamos en la tabla 2 del apeacutendice en lana de 10 y el rengloacuten de 6 grados de libertad Ahiacute vemos que el valor apropiado de t es 19mo nos preocupa si b1 (la pendiente del plano de regresioacuten de la muestra) es significativamferente de B1 (la pendiente hipoteacutetica del plano de regresioacuten de la poblacioacuten) eacutesta es una pdos colas y los valores criacuteticos son Ϯ1943 El coeficiente de regresioacuten estandarizado es 2se encuentra fuera de la regioacuten de aceptacioacuten de nuestra prueba de hipoacutetesis Por consiguichazamos la hipoacutetesis nula de que B1 todaviacutea es igual a 0400 En otras palabras existe unacia suficientemente grande entre b1 y 0400 para concluir que B1 ha cambiado respecto a histoacuterico Por esto sentimos que cada 100 horas adicionales de trabajo en auditoriacuteas de camaumentan la cantidad de descubrimientos de impuestos no pagados en $400000 como lo hel pasado

Ademaacutes de la prueba de hipoacutetesis podemos construir un intervalo de confianza para cude los valores de Bi Del mismo modo que bi es una estimacioacuten puntual de Bi estos intervalofianza son estimaciones de intervalo de Bi Para ilustrar el proceso de construccioacuten de interconfianza encontremos un intervalo de confianza del 95 para B3 en el ejemplo del IRS Lrelevantes son

b3 ϭ 0405 de la figura 13-2sb3 ϭ 00422

t ϭ 2447 larr Nivel de significancia del 5 y 6 grados de libertad

Intervalo deconfianza para B i

Realizacioacuten de la

prueba de hipoacutetesis

0597 ndash 0400ᎏᎏ

0081

b1 ndash B10ᎏ

sb1

Anaacute l i s i s de r e gr e s i oacutenLa ec uaci oacuten de r egr es i oacuten esDESCUBRE = - 45 0 + 0 597 AUDI TORIacute A + 1 18 COMPUTADORA + 0 405 RECOMPENSA

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 45 796 4 878 - 9 39 0 000AUDI TORIacute A 0 50697 0 08112 7 36 0 000COMPUTADORA 1 17684 0 08407 14 00 0 000RECOMPENSAS 0 40511 0 04223 9 59 0 000

s = 0 2861 R- s q = 98 3

FIGURA 13-2

Salida de Minitab(figura repetida)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2156

Con esta informacioacuten podemos calcular el intervalo de confianza de la siguiente manera

b3 ϩ t (sb3) ϭ 0405 ϩ 2447(00422)

ϭ 0508 larr Liacutemite superior

b3 Ϫ t (sb3) ϭ 0405 Ϫ 2447(00422)

ϭ 0302 larr Liacutemite inferior

Vemos que podemos tener una seguridad del 95 de que cada $1000 adicionales pagados a los formantes aumenta el descubrimiento de impuestos no pagados en una cantidad entre $302000$508000

A menudo estaremos interesados en preguntas del tipo iquesten realidad Y depende de X i Por ejeplo podriacuteamos preguntar si descubrir impuestos no pagados en realidad depende de las horas encomputadora Con frecuencia esta pregunta se plantea como iquestes X i una variable explicativa sigficativa de Y Si piensa un poco maacutes se convenceraacute de que si Bi 0 Y depende de las X i (esto esvariacutea cuando X i variacutea) y no depende de X i si Bi ϭ 0

Vemos que nuestra pregunta conduce a establecer hipoacutetesis de la forma

H0 Bi ϭ 0 larr Hipoacutetesis nula X i no es una variable explicativa significativa

H1 Bi 0 larr Hipoacutetesis alternativa X i es una variable explicativa significativa

Podemos probar estas hipoacutetesis utilizando la ecuacioacuten 13-8 del mismo modo que cuando probamnuestras hipoacutetesis acerca de si B1 todaviacutea era igual a 0400 Sin embargo existe una forma maacutes faacutede hacerlo usando la columna de la figura 13-2 de ldquocociente- t rdquo Observemos de nuevo la ecuaci13-8

t ϭ [13-

Como nuestro valor hipoteacutetico de Bi es cero el valor estandarizado del coeficiente de regresioacutedenotado por t o se convierte en

t o ϭ

El valor de t o se conoce como valor t ldquocalculadordquo Eacuteste es el nuacutemero que aparece en la columna equetada como ldquocociente-t rdquo en la figura 13-2 Denotemos por t c el valor t ldquocriacuteticordquo que buscamos

la tabla 2 del apeacutendice Entonces como la prueba para determinar si X i es una variable explicatisignificativa es una prueba de dos colas soacutelo necesitamos verificar si Ϫt c Յ t o Յ t c

Uso de valores t

calculados en lasalida de Minitab

biᎏ

sbi

bi ndash Bi0ᎏ

sbi

iquestEs significativa unavariable explicativa

Prueba para determinar si una variable es o no significativa

Ϫt c Յ t o Յ t c [13-9

donde

bull t c ϭ valor t adecuado (con n Ϫ k Ϫ 1 grados de libertad) para el nivel de significancia deprueba

bull t o ϭ bi sbi ϭ valor t observado (o calculado) obtenido con el paquete de software

Si t o

cae entre Ϫt c

y t c aceptamos H0 y llegamos a la conclusioacuten de que X

ino es una variable exp

cativa significativa En cualquier otro caso rechazamos H0 y concluimos que X i es una variable eplicativa significativa

Probemos al nivel de significancia de 001 si las horas en computadora constituyen una variabexplicativa significativa para los impuestos no pagados descubiertos De la tabla 2 del apeacutendice cn Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad y ϭ 001 vemos que t c ϭ 3707 De la figura 13tenemos que t o = 1400 Como t o Ͼ t c concluimos que el tiempo en computadora es una variab

Prueba de lasignificancia de lavariable horas decomputadora en elproblema del IRS

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2256

explicativa significativa De hecho al observar los valores t calculados para las otras dos vindependientes (tiempo de auditoriacuteas de campo t o ϭ 736 y recompensa a informantes t ovemos que tambieacuten son variables explicativas significativas

Podemos tambieacuten utilizar la columna de ldquoprdquo para probar si X i es una variable explicativacativa De hecho utilizando esa informacioacuten ni siquiera necesitamos usar la tabla 2 del aLos elementos de esta columna son los valores prob para las hipoacutetesis

H0 Biϭ 0

H1 Bi 0

Recuerde del anaacutelisis hecho en el capiacutetulo 9 que estos valores prob constituyen la probabque cada bi esteacute tan lejos de cero como (o maacutes) el valor observado obtenido de la regresioacutenverdadera Como se ilustra en la figura 13-3 solamente necesitamos comparar estos valocon el nivel de significancia de la prueba para determinar si X i es o no una variable expsignificativa para Y

Probar la significancia de una variable explicativa es siempre una prueba de dos colas Lble independiente X i es una variable explicativa significativa si bi es significativamente dife

cero es decir si t o es un nuacutemero grande positivo o negativoPara el ejemplo del IRS repetimos las pruebas con ϭ 001 Para cada una de las tres v

independientes p es menor que 001 de forma que podemos concluir que cada una de ellanificativa

Inferencias acerca de la regresioacuten como un todo

(usando una prueba F )

Suponga que cubre con papel un tablero para dardos y lanza varios dardos sobre eacutel Despueacuteberlo hecho tendraacute algo muy parecido a un diagrama de dispersioacuten Suponga entonces quuna recta de regresioacuten a este conjunto de ldquopuntos observadosrdquo y calcula r

2 Debido a que lofueron lanzados aleatoriamente usted espera obtener un valor bajo de r

2 puesto que en esten realidad no explica a Y Sin embargo si hace esto muchas veces ocasionalmente observalor alto de r

2 por pura casualidadDada cualquier regresioacuten simple (o muacuteltiple) es natural preguntarse si el valor de r2 (

realmente indica que las variables independientes explican a Y o si esto sucede por cas

A menudo esta interrogante se plantea de la siguiente manera iquestla regresioacuten como un todo ficativa En la uacuteltima seccioacuten vimos coacutemo decidir si una X i individual es una variable exp

Significancia de laregresioacuten comoun todo

FIGURA 13-3

Uso de ldquoprdquo paradeterminar si X i esuna variable expli-cativa significativa

Regioacuten de aceptacioacuten Regioacuten de aceptacioacuten

2 del aacuterea

2 del aacuterea

2 del aacuterea

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

ndasht c

ndasht o

t o

t c

0

(a) p es mayor que X

i no es una variable

explicativa significativa

(b) p es menor que X

i es una variable

explicativa significativa

ndasht o

ndasht c

t c

0

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2356

significativa ahora veremos coacutemo decidir si todas las X i tomadas en conjunto explican significavamente la variabilidad observada de Y Nuestras hipoacutetesis son

H0 B1 ϭ B2 ϭ ϭ Bk ϭ 0 larr Hipoacutetesis nula Y no depende de las X i

H1 por lo menos una Bi 0 larr Hipoacutetesis alternativa Y depende de al menos una de las X i

Cuando analizamos r 2 en el capiacutetulo 12 consideramos la variacioacuten total en Y sum(Y Ϫ Y ෆ )2 la p

te de dicha variacioacuten que explica la regresioacuten sum(Y ˆ Ϫ Y ෆ )2 y la parte no explicada de la variacioacutensum(Y Ϫ Y ˆ )2 La figura 13-4 es un duplicado de la figura 12-15 Sirve como repaso de la relacioacuten etre la desviacioacuten total la desviacioacuten explicada y la desviacioacuten no explicada para un solo dato en uregresioacuten simple Aunque no podamos dibujar una figura similar para una regresioacuten muacuteltiple coceptualmente estamos haciendo lo mismo

Al analizar la variacioacuten en Y fijamos nuestra atencioacuten en tres teacuterminos diferentes cada uno de cuales es una suma de cuadrados Los denotamos con

Suma de cuadradosy sus grados delibertad

Anaacutelisis de lavariacioacuten de losvalores Y

FIGURA 13-4

Desviacioacuten totaldesviacioacutenexplicada ydesviacioacuten noexplicada paraun valor observadode Y

Y

X

Un valor observado de lavariable dependiente (Y )

R e c t a d

e r e g r e s

i oacute n

Desviacioacuten no explicada de esta Y respectoa su media Y

(Y ndash Y )^

Desviacioacuten explicada deesta Y respecto a su media Y

(Y ndash Y )^Y

Valor estimado de esta Y

a partir de la recta de regresioacuten (Y )^

Desviacioacuten total de esta Y

respecto a su media Y

(Y ndash Y )

Tres sumas de cuadrados

SCT ϭ suma de cuadrados total (es decir la parte explicada) ϭ sum(Y Ϫ Y ෆ )2

SCR ϭ suma de cuadrados de la regresioacuten (es decir la parte explicada) ϭ sum(Y ˆ Ϫ Y ෆ )2 [13-10

SCE ϭ suma de cuadrados del error (es decir la parte no explicada) ϭ sum(Y Ϫ Y ˆ )2

Estaacuten relacionadas por la ecuacioacuten

que dice que la variacioacuten total en Y puede dividirse en dos partes la parte explicada y la no explicaCada una de estas sumas de cuadrados tiene un nuacutemero asociado de grados de libertad SCT t

ne n Ϫ 1 grados de libertad (n observaciones menos un grado de libertad debido a que la media la muestra estaacute fija) SCR tiene k grados de libertad porque existen k variables independientes qse utilizaron para explicar Y Finalmente SCE tiene n Ϫ k Ϫ 1 grados de libertad porque utilizamnuestras n observaciones para estimar k ϩ 1 constantes a b1 b2 bk Si la hipoacutetesis nula es ci

ta el cociente

Descomposicioacuten de la variacioacuten total de Y

SCT ϭ SCR ϩ SCE [13-1

Cociente F

F ϭ [13-12SCR k ᎏᎏ

SCE(n ndash k ndash 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2456

tiene una distribucioacuten F con k grados de libertad en el numerador y n Ϫ k Ϫ 1 grados de libel denominador Si la hipoacutetesis nula es falsa entonces el cociente tiende a ser maacutes grande qula hipoacutetesis nula es verdadera De modo que si el cociente F es demasiado grande (seguacuten lo na el nivel de significancia de la prueba y el valor apropiado de la tabla 6 del apeacutendice) rechH0 y concluimos que la regresioacuten como un todo es significativa

La figura 13-5 presenta la salida de Minitab para el problema del IRS Esta parte del rincluye los cocientes F calculados para la regresioacuten en ocasiones llamado anaacutelisis de v

(ANOVA) para la regresioacuten Probablemente se pregunte si esto tiene algo que ver con el anaacutelisrianza que estudiamos en el capiacutetulo 11 La respuesta es siacute Aunque no lo hicimos es posibletrar que el anaacutelisis de varianza visto en el capiacutetulo 11 tambieacuten contempla la variacioacuten total las observaciones alrededor de la gran media y la divide en dos partes una explicada por lascias entre los distintos grupos (que corresponde a lo que llamamos varianza entre columnas)

no explicada por dichas diferencias (que corresponde a la varianza dentro de columnas) Estcisamente anaacutelogo a lo que acabamos de hacer en la ecuacioacuten 13-11Para el problema del IRS vemos que SCR ϭ 29109 (con k ϭ 3 grados de libertad) SCE

(con n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad) y que

F ϭ ϭ ϭ 11833

Los elementos en la columna ldquoMCrdquo son justo las sumas de cuadrados divididas entre sus glibertad Para 3 grados de libertad en el numerador y 6 en el denominador la tabla 6 del apeacutence que 978 es el liacutemite superior de la regioacuten de aceptacioacuten para un nivel de significancia El valor calculado de F 11833 estaacute muy por arriba de 978 de manera que se ve que la r

como un todo es altamente significativa Se puede llegar a la misma conclusioacuten si se observresultado del programa dice que ldquo prdquo es 0000 Debido a que este valor prob es menor que elsignificancia ϭ 001 se concluye que la regresioacuten completa es significativa De esta mapuede usar la p de ANOVA como prueba sin tener que utilizar la tabla 6 del apeacutendice para bvalor criacutetico de F Esto es anaacutelogo a la manera en que se usaron los valores de p en la figura ra probar la significancia de las variables explicativas individuales

Multicolinealidad en la regresioacuten muacuteltiple

En el anaacutelisis de regresioacuten muacuteltiple los coeficientes de regresioacuten a menudo se vuelven

confiables conforme aumenta el grado de correlacioacuten entre las variables independie

existe un alto nivel de correlacioacuten entre algunas de las variables independientes nos enfrenun problema que los estadiacutesticos llaman multicolinealidad

La multicolinealidad puede presentarse si deseamos estimar la recuperacioacuten de las ventaempresa y utilizamos tanto el nuacutemero de vendedores empleados como sus salarios totales Cvalores asociados con estas dos variables independientes tienen una correlacioacuten alta neceusar soacutelo un conjunto de ellos para realizar nuestra estimacioacuten De hecho al agregar una segriable que estaacute correlacionada con la primera se distorsionan los valores de los coeficientgresioacuten Sin embargo a menudo podemos predecir bien Y incluso cuando haya multicoline

Consideremos un ejemplo donde existe multicolinealidad para ver coacutemo afecta a la regresrante los 12 meses pasados el gerente del restaurante Pizza Shack ha estado poniendo unaanuncios en el perioacutedico local Los anuncios se programan y pagan el mes anterior a que ap

Un ejemplo demulticolinealidad

Definicioacuten y efecto dela multicolinealidad

9703ᎏ

0082

29109 3ᎏ

0491 6Prueba de lasignificancia de laregresioacuten en elproblema del Serviciode Contribuciones

Anaacutelisis devarianza parala regresioacuten

Prueba F de laregresioacuten como

un todo

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 29 1088 9 7029 118 52 0Er r or 6 0 4912 0 0819Tot al 9 29 6000

FIGURA 13-5Salida de Minitabanaacutelisis devarianza

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2556

Cada anuncio contiene un cupoacuten que permite llevarse dos pizzas pagando solamente la de mcio El gerente recolectoacute los datos de la tabla 13-4 y le gustariacutea utilizarlos para predecir las vpizzas

En las figuras 13-6 y 13-7 se dieron los resultados de Minitab para las regresiones respelas ventas totales sobre el nuacutemero de anuncios y sobre el costo

Para la regresioacuten sobre el nuacutemero de anuncios tenemos que el valor t observado es 395grados de libertad y un nivel de significancia de ϭ 001 se encontroacute que el valor t criacuteticdo de la tabla 2 del apeacutendice) es 3169 Como t o Ͼ t c (o de manera equivalente como p es m001) concluimos que el nuacutemero de anuncios es una variable explicativa altamente signifilas ventas totales Note tambieacuten que r 2 ϭ 610 de modo que el nuacutemero de anuncios explximadamente el 61 de la variacioacuten en las ventas de pizzas

Para la regresioacuten sobre el costo de los anuncios el valor t observado es 454 de modo qude los anuncios es una variable explicativa de las ventas totales todaviacutea maacutes significativa que ro de anuncios (para los que el valor t observado fue soacutelo 395) En esta regresioacuten r 2 ϭ 673

el costo de los anuncios explica aproximadamente el 67 de la variacioacuten de las ventas de pizComo ambas variables explicativas son altamente significativas por siacute mismas intentam

zar ambas en una regresioacuten muacuteltiple El resultado se presenta en la figura 13-8La regresioacuten muacuteltiple es altamente significativa como un todo ya que la p de ANOVA e

Uso de ambas varia-bles explicativas enuna regresioacuten muacuteltiple

Dos regresionessimples

Datos de ventas y anun-cios para el restaurantePizza Shack

Tabla 13-4 X 1 X 2 Y

Nuacutemero Costo de anuncios Venta tode anuncios publicados de pizz

Mes publicados (cientos de doacutelares) (miles de d

Mayo 12 139 436

Junio 11 120 380

Julio 9 93 301

Agosto 7 97 353

Septiembre 12 123 464

Octubre 8 114 342

Noviembre 6 93 302

Diciembre 13 143 407

Enero 8 102 385

Febrero 6 84 226

Marzo 8 112 376

Abril 10 111 352

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esVENTAS = 16 9 + 2 08 ANUNCI OS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 16 937 4 982 3 40 0 007ANUNCI OS 2 0832 0 5271 3 95 0 003

s = 4 206 R- s q = 61 0

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 1 276 31 276 31 15 62 Er r or 10 176 88 17 69Tot a l 11 453 19

Figura 13-6

Regresioacuten de lasventas sobre elnuacutemero deanuncios conMinitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2656

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2756

gar el nuacutemero de anuncios como segunda variable explicativa ademaacutes del costo de los anuncios eplica nada maacutes alrededor del 1 adicional de la variacioacuten de las ventas totales

En este punto es justo preguntarse iquestqueacute variable realmente explica la variacioacuten de las ventotales en la regresioacuten muacuteltiple La respuesta es que ambas la explican pero no podemos separ

sus contribuciones individuales debido a que estaacuten altamente correlacionadas entre siacute E

consecuencia sus coeficientes en la regresioacuten muacuteltiple tienen errores estaacutendar altos valore

calculados relativamente bajos y valores prob Ͼ | t | relativamente altos

iquestDe queacute manera nos afecta esta multicolinealidad Todaviacutea podemos hacer predicciones relativmente precisas cuando se encuentra presente note que para la regresioacuten muacuteltiple (la salida se dala figura 13-8) el error estaacutendar de la estimacioacuten que determina el ancho de los intervalos de co

fianza para las predicciones es 3989 mientras que para la regresioacuten simple con el costo de los anucios como variable explicativa (salida en la figura 13-7) tenemos se ϭ 3849 Lo que no podemhacer es predecir con mucha precisioacuten coacutemo cambiaraacuten las ventas si aumentamos en uno el nuacutemede anuncios La regresioacuten muacuteltiple dice que b1 ϭ 0625 (esto es cada anuncio aumenta las ventotales de pizzas alrededor de $625) pero el error estaacutendar de este coeficiente es 112 (es decir apximadamente $1120)

Las contribucionesindividuales nopueden separarse

Ejercicios 134

Ejercicios de autoevaluacioacuten

EA 13-4 Edith Pratt es una ocupada ejecutiva de una compantildeiacutea de transporte de carga a nivel nacional y va tara una junta porque no encuentra la salida de la regresioacuten muacuteltiple elaborada por un asistente Si la regsioacuten total es significativa al nivel 005 ella desea usar las salida de computadora como evidencia para fudamentar algunas ideas que expondraacute en la reunioacuten Sin embargo su ayudante estaacute enfermo De hectoda la informacioacuten que tiene de la regresioacuten muacuteltiple es un trozo de papel con los siguientes datos

Regresioacuten paraEdith Pratt

SCR 8724 con gl

SCE con 17 gl

SCT 10236 con 24 gl

Como el papel ni siquiera tiene todos los nuacutemeros Edith ha concluido que no es uacutetil Usted sin embardebe saber maacutes que ella iquestPuede Edith entrar en la junta o debe seguir buscando la salida de computador

EA 13-5 Una pequentildea liacutenea aeacuterea de Nueva Inglaterra realizoacute una encuesta sobre sus 15 terminales y obtuvo losguientes datos para el mes de febrero donde

VENTAS ϭ ingreso total seguacuten el nuacutemero de boletos vendidos (en miles de doacutelares)

PROMOCϭ cantidad gastada en promociones de la liacutenea aeacuterea en el aacuterea (en miles de doacutelares)

COMPET ϭ nuacutemero de liacuteneas aeacutereas que compiten en esa terminal

GRATIS ϭ nuacutemero de pasajeros que vuelan gratis (por diferentes razones)

Sugerencia el concepto de hacer infe-rencias respecto a una regresioacuten muacutelti-ple es justo lo mismo que se hizo en elcapiacutetulo 12 cuando hicimos inferencias

respecto a una recta de regresioacuten excepto que ahora se em-

plean dos o maacutes variables independientes Advertencia lamulticolinealidad es un problema que debe manejarse enla regresioacuten muacuteltiple y es necesario desarrollar una com-prensioacuten con sentido comuacuten Recuerde que todaviacutea puedehacer predicciones precisas cuando estaacute presente Pero re-cuerde tambieacuten que no puede decir con mucha precisioacuten

cuaacutento cambiaraacute la variable dependiente si ldquomanipulardquo lavariables independientes Entonces el objetivo debe seminimizar la multicolinealidad Sugerencia la mejor regresioacuten muacuteltiple es la que explica la relacioacuten entre los datos asentildealar la responsabilidad de la mayor proporcioacuten de la va

riacioacuten en la variable dependiente con el menor nuacutemero dvariables independientes Advertencia no es una buenidea incluir demasiadas variables independientes soacutelo porque cuenta con una computadora y un paquete de softwarpara estadiacutestica

SUGERENCIAS

Y

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2856

Ventas (doacutelares) Promoc (doacutelares) Compet Gratis

793 25 10 3

2001 55 8 6

1632 60 12 9

2001 79 7 16

1460 52 8 15

1777 76 12 9

309 20 12 8

2919 90 5 10

1600 40 8 43394 96 5 16

1596 55 11 7

863 30 12 6

2375 60 6 10

1072 50 10 4

1550 35 10 4

a) Utilice la siguiente salida de Minitab para determinar la ecuacioacuten de regresioacuten que mejor se ara la liacutenea aeacuterea

La ec uaci oacuten de r egr es i oacuten esVENTAS ϭ 172 ϩ 25 9 PROMOVϪ 13 2 COMPET Ϫ 3 04 GRATI S

Pr onos t i cador Coef Des vEs t Coci ent e - t Cons t ant e 172 34 51 38 3 35 0PROMOV 25 950 4 877 5 32 0COMPET - 13 238 3 686 - 3 59 0GRATI S - 3 041 2 342 - 1 30 0

b) iquestLos pasajeros que vuelan gratis ocasionan una disminucioacuten significativa en las ventas Fpruebe las hipoacutetesis apropiadas Use ϭ 005

c) iquestUn incremento de $1000 en las promociones cambia las ventas en $28000 o el cambio ecativamente diferente de $28000 Formule y pruebe las hipoacutetesis adecuadas Use ϭ 010

d) Calcule un intervalo de confianza del 90 para el coeficiente de la pendiente de la COMPET

Aplicaciones

13-22 Mark Lowtown publica el perioacutedico Mosquito Junction Enquirer y tiene problemas para predectidad de papel perioacutedico que necesita imprimir diariamente Eligioacute aleatoriamente 27 diacuteas del arior y registroacute la siguiente informacioacuten

PESO ϭ peso en libras de papel perioacutedico para la edicioacuten de ese diacutea

CLASIFICADOS ϭ nuacutemero de anuncios clasificados

PUBLICIDAD ϭ nuacutemero de anuncios publicitarios

PLANA COMPLETA ϭ nuacutemero de anuncios a una plana

Utilizando Minitab para hacer una regresioacuten de PESO sobre las otras tres variables Mark obtuguiente salida

Pr onos t i cador Coef Des vEs t Coci ent e- t Cons t ant e 1072 95 872 43 1 23 0CLASI FI CADOS 0 251 0 126 1 99 0PUBLI CI DAD 1 250 0 884 1 41 0PLANA COMPLETA 250 66 67 92 3 69 0

a) Mark siempre ha pensado que cada anuncio publicitario utiliza al menos 3 libras de papel iquestsioacuten le da una razoacuten significativa para dudar esto al nivel del 5

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2956

b) De manera similar Mark siempre ha creiacutedo que cada anuncio clasificado utiliza aproximmedia libra de papel iquestTiene ahora Mark una razoacuten significativa para dudar esto al nivel del

c) Mark vende espacios de anuncios de plana completa a los comerciantes locales a $30 la paacutegberaacute pensar en ajustar sus tarifas si el papel perioacutedico le cuesta $009 por libra Suponga costos son despreciables Establezca expliacutecitamente las hipoacutetesis y una conclusioacuten (Sugere

jando todo lo demaacutes constante cada anuncio adicional de plana completa tiene un costo de bras de papel ϫ $009 por libra ϭ $2256 El punto de equilibrio es 333333 libras iquestPor quel coeficiente de pendiente para PLANA COMPLETA es significativamente mayor que Mark no estaacute obteniendo ganancias y debe cambiar sus tarifas)

13-23 Para los datos del ejercicio 13-18 y un nivel de significancia de 010 iquestcuaacuteles variables son sign

mente explicativas de los resultados de los exaacutemenes (Habiacutea 12 estudiantes en la muestra) 13-24 Para los datos del ejercicio 13-18 y la siguiente salida de Minitab del procedimiento de regresiple hecho por Bill

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 3134 42 783 60Er r or 7 951 25 135 89Tot a l 11 4085 67

a) iquestCuaacutel es el valor observado de F b) A un nivel de significancia de 005 iquestcuaacutel es el valor criacutetico de F que se debe utilizar para d

si la regresioacuten como un todo es significativac) Basaacutendose en las respuestas a los incisos a) y b) iquestes la regresioacuten significativa como un tod

13-25 Remiacutetase al ejercicio 13-19 A un nivel de significancia de 001 iquestes la variable DISTANCIA uble explicativa significativa para VENTAS

13-26 Para los datos del ejercicio 13-19 y la siguiente salida adicional de Minitab al correr la regresioacuten

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 2861495 715374 102 39 0Er r or 18 125761 6896 7Tot a l 22 2987256

Al nivel de significancia de 005 iquestes la regresioacuten significativa como un todo

13-27 Henry Lander es el director de produccioacuten de la Alecos Corporation de Caracas Venezuela Hede que le ayude a determinar una foacutermula para predecir el ausentismo de los empacadores de chipoacutetesis es que la temperatura diaria promedio puede explicar el porcentaje de ausentismo Durios meses reuacutene datos ejecuta el procedimiento de regresioacuten simple y encuentra que la tempeplica 66 de la variacioacuten en el ausentismo Pero Henry no estaacute convencido de que eacuteste sea un cador satisfactorio Sugiere que la precipitacioacuten pluvial diaria podriacutea tambieacuten tener algo que vausentismo de modo que registra los datos correspondientes y hace una regresioacuten del ausentismte el tiempo de lluvias y obtiene un valor R2 de 059 ldquoiexclEurekardquo grita usted ldquoiexclLo tengo Con uticador que explica 66 y otro que explica 59 todo lo que tengo que hacer es una regresioacutenutilizando ambos y seguramente tendreacute un pronosticador casi perfectordquo Para su desaacutenimo sin la regresioacuten muacuteltiple tiene una R

2 de soacutelo 68 que es solamente un poco mejor que la variablperatura sola iquestCoacutemo puede explicar esta aparente discrepancia

13-28 Juan Armenlegg administrador de Rockyrsquos Diamond y Jewelry Store estaacute interesado en desamodelo para estimar la demanda del consumidor para su costosa mercanciacutea Como la mayoriacutea de

tes compran diamantes y joyas a creacutedito Juan estaacute seguro de que dos factores que deben influirmanda de los clientes son la tasa real de inflacioacuten anual y la tasa real de intereses sobre preacutestamprincipales bancos del paiacutes Explique algunos problemas que Juan podriacutea encontrar si fuera a dun modelo de regresioacuten basado en estas dos variables de prediccioacuten

13-29 Un nuevo programa de juegos Check That Model pide a los concursantes que especifiquen el nuacutenimo de paraacutemetros que necesitan para determinar si un modelo de regresioacuten muacuteltiple es signifimo un todo para ϭ 001 Usted ganoacute la apuesta con 4 paraacutemetros Use la siguiente informacioacutenterminar si la regresioacuten es significativa

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3056

R 2

ϭ 07452

SCE ϭ 1254

n ϭ 18

Nuacutemero de variables independientes ϭ 3

13-30 La Scottish Turist Agency estaacute interesada en el nuacutemero de turistas que entran al paiacutes cada semanrante la temporada alta Se recolectaron los siguientes datos

Turistas (Y ) ϭ nuacutemero de turistas que entran a Escocia en una semana (en miles)

Cambio (X 1)ϭ nuacutemero de libras escocesas compradas por $1 doacutelar

Precio (X 2) ϭ nuacutemero de libras escocesas cobradas por viaje redondo en camioacuten de Londres a Edimburgo

Promoc (X 3) ϭ cantidad gastada en promocioacuten del paiacutes (en miles de libras escocesas)Temp (X 4) ϭ temperatura media durante la semana en Edimburgo (en grados Celsius)

Turistas (Y ) Cambio (X 1) Precio (X 2) Promoc (X 3) Temp (X 4)

69 061 40 87 154

71 059 40 88 156

68 063 40 85 154

79 061 35 86 153

76 060 35 94 158

82 065 35 99 162

80 058 35 98 164

84 059 35 102 166

97 061 30 114 174

98 062 30 116 172

72 057 40 84 176

67 055 40 86 164

a) Utilice el paquete de software que tenga para determinar la ecuacioacuten de regresioacuten que mejote a los datos de la agencia de turismo

b) iquestEs la tasa de cambio una variable explicativa significativa Establezca y pruebe las hipoacutetesidas a un nivel de significancia de 010

c) Un incremento de 1000 libras en las promociones iquestaumenta el nuacutemero de turistas en maacutesEstablezca y pruebe las hipoacutetesis adecuadas para un nivel de significancia de 005

d) Calcule un intervalo de confianza del 95 para el coeficiente de la pendiente de Temp

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-4 Como SCT ϭ SCR ϩ SCE SCE ϭ SCT Ϫ SCR ϭ 10236 Ϫ 8724 ϭ 1512Como gl SCT ϭ gl SCR ϩ gl SCE gl SCR ϭ gl SCT Ϫ gl SCE ϭ 24 Ϫ 17 ϭ 7

Entonces F ϭ ϭ ϭ 1401

F CRiacuteT ϭ F (7 17 005) ϭ 261Como F OBS gt F CRIacuteT se concluye que la regresioacuten es significativa como un todo Edith debe conticando la salida de computadora de la regresioacuten para usarla en la junta

EA 13-5 De la salida de computadora se obti enen los siguientes resultadosa) VENTAS ϭ 17234 ϩ 25950PROMOC Ϫ13238COMPET Ϫ 3041GRATISb) H0 BGRATIS ϭ 0 H1 BGRATIS Ͻ 0 ϭ 005

Eacutesta es una prueba de una cola y el valor prob en los resultados es para la alternativa de dos c BGRATIS 0 De manera que para esta prueba el valor prob es 02212 ϭ 0111 Ͼ ϭ 00que no se puede rechazar H0 las ventas no disminuyen significativamente cuando aumenta ro de pasajeros que vuelan gratis

c) H0 BPROMOC ϭ 28 H1 BPROMOC 28 ϭ 010

87247ᎏᎏ

151217SCRk ᎏᎏ

SCE(n Ϫ k Ϫ 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3156

El valor observado t de los resultados de regresioacuten es

ϭ ϭ Ϫ0420

Con 11 grados de libertad y ϭ 010 en ambas colas combinadas los valores criacuteticos t parba son Ϯ1796 asiacute el valor observado estaacute dentro de la regioacuten de aceptacioacuten No se rechacambio en VENTAS para un incremento de una unidad ($1000) en PROMOC no es significate diferente de 28 ($28000)

d) Con 11 grados de libertad el valor t para un intervalo del 90 de confianza es 1796 por lo

tervalo esbCOMP Ϯ 1796sbCOMP

ϭ Ϫ13238 Ϯ 1796(3686)

ϭ Ϫ13238 Ϯ 6620 ϭ (Ϫ19858 Ϫ 6618)

La liacutenea aeacuterea puede tener una seguridad del 90 de que el ingreso por los boletos en una ofminuye entre $6600 y $19900 aproximadamente con cada liacutenea aeacuterea adicional que comp

135 Teacutecnicas de modelado

Dada una variable que deseamos explicar y un conjunto de variables explicativas potencialehaya varias ecuaciones de regresioacuten diferentes que podamos estudiar dependiendo de queacute explicativas incluyamos y de coacutemo lo hagamos Cada una de esas ecuaciones de regresioacutence como modelo Las teacutecnicas de modelado son las distintas formas en que podemos incluriables explicativas y verificar queacute tan apropiados son los modelos de regresioacuten Existen municas de modelado diferentes pero soacutelo veremos dos de las maacutes utilizadas

Datos cualitativos y variables ficticias

En todos los ejemplos de regresioacuten que hemos visto hasta ahora los datos manejados hanmeacutericos o cuantitativos Pero ocasionalmente nos enfrentaremos con una variable categoacuterilitativa En el problema del inicio el capiacutetulo el director de personal desea ver si el salarioun vendedor depende de su sexo En la tabla 13-5 repetimos los datos de dicho problema

Por el momento ignore la antiguumledad y utilice la teacutecnica desarrollada en el capiacutetulo 9 bar la diferencia entre las medias de dos poblaciones para ver si los hombres ganan maacutes qu

jeres Pruebe con ϭ 001 Si tomamos a los hombres como la poblacioacuten 1 y a las mujerespoblacioacuten 2 probaremos las siguientes hipoacutetesis

H0 1 ϭ 2 larr Hipoacutetesis nula no existe discriminacioacuten por sexo en los salarios base

H1 1 Ͼ 2 larr Hipoacutetesis alternativa se discrimina a las mujeres en su salario base

ϭ 001 larr Nivel de significancia

Revisioacuten del enfoqueanterior del problema

Buacutesqueda dediferentes modelos

25950 Ϫ 28ᎏᎏ

4877

(bPROMOC Ϫ 28)ᎏᎏ

sbPROMOC

Datos para el problemade discriminacioacuten porsexo

Tabla 13-5 Vendedores VendedorasAntiguumledad Salario base Antiguumledad Salario base(en meses) (en miles) (en meses) (en miles)

6 75 5 62

10 86 13 87

12 91 15 94

18 103 21 98

30 130

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3256

A continuacioacuten bosquejamos el anaacutelisis Si tiene problemas para seguirlo deberaacute repasamente la seccioacuten 93

n1 ϭ 5 n2 ϭ 4

x ෆ1 ϭ 97 x ෆ2 ϭ 8525

s2

1 ϭ 4415 s2

2 ϭ 2609

s2

p ϭ

ϭ

ϭ 3641

x ෆ1Ϫ x

ෆ2ϭ s pΊ ϩ

ϭ 128

t ϭ

ϭ

ϭ 092

Con siete grados de libertad el valor t criacutetico para una prueba de cola superior con ϭ 001 eComo el valor t observado de 092 es menor que 2998 no podemos rechazar H0

Entonces el anaacutelisis concluye que no parece haber discriminacioacuten por sexo en los salarPero recuerde que hasta ahora se han ignorado los datos de antiguumledad laboral para el anaacuteli

Antes de seguir vea el diagrama de dispersioacuten de los datos En la figura 13-9 los punto

corresponden a los hombres y los blancos a las mujeres El diagrama de dispersioacuten muestraridad que el salario base aumenta con los antildeos de antiguumledad pero si con la mirada sigue lo qla recta de regresioacuten notaraacute que los puntos negros tienden a estar arriba de ella y los blancos

La figura 13-10 da la salida de una regresioacuten del salario base sobre los meses de antiguumlelos resultados se ve que la antiguumledad es una variable explicativa altamente significativa

Ademaacutes r 2

ϭ 926 que indica que la variable meses de antiguumledad explica cerca del 9variacioacuten en el salario base La figura 13-11 contiene parte de la salida que no se vio antesbla de residuos Para cada punto el residuo es simplemente Y Ϫ Y ˆ que se reconoce como el

Una ldquomiradardquo a los

datos

El enfoque anterior nodetecta discriminacioacuten

(97 ndash 8525) ndash 0ᎏᎏ

128

( x ෆ1 ndash x ෆ2) ndash (1 Ϫ 2)H0

ᎏᎏᎏ

ˆ x ෆ1Ϫ

x ෆ2

1ᎏ

n2

1ᎏ

n1

4(4415) ϩ 3(2609)ᎏᎏᎏ5 ϩ 4 ndash 2

(n1 ndash 1)s21 ϩ (n2 ndash 1)s22ᎏᎏᎏ

n1 ϩ n2 ndash 2

FIGURA 13-9

Diagrama de dis-persioacuten de salariosbase contra mesesde antiguumledad

4 8 12 16 20 24 28

4

8

12

Meses de antiguumledad

S a l a r i o ( m i l e s d e d oacute l a r e s )

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3356

el ajuste de la recta de regresioacuten en ese punto En la figura 13-11 AJUST1 son los valores y RESI1 son los residuos

Tal vez la parte maacutes importante del anaacutelisis del resultado de una regresioacuten sea estusiduos Si la regresioacuten incluye todos los factores explicativos relevantes estos residuo

ser aleatorios Dicho de otro modo si los residuos muestran cualquier patroacuten no aleat

to indica que hay algo sistemaacutetico que afecta el proceso y que no hemos tomado en cu

manera que buscamos patrones en los residuos o para decirlo de forma maacutes pintoresca ldquopmos a los residuos hasta hacerlos hablarrdquo

Si observamos los residuos presentados en la figura 13-11 vemos que los primeros cincoson positivos De modo que para los vendedores tenemos Y ndash Y ˆ Ͼ 0 o Y Ͼ Y ˆ es decir laregresioacuten cae abajo de estos cinco puntos Tres de los cuatro uacuteltimos residuos son negaticonsiguiente para las vendedoras tenemos Y Ϫ Y ˆ Ͻ 0 o Y Ͻ Y ˆ asiacute que la recta de regresicuentra arriba de tres de los cuatro puntos Esto confirma lo que vimos al observar el diagdispersioacuten de la figura 13-9 Este patroacuten no aleatorio en los residuos sugiere que el sexo siacute etor determinante del salario base

iquestCoacutemo podemos incorporar el sexo de los vendedores dentro del modelo de regresioacutencemos utilizando un dispositivo llamado variable ficticia (o variable indicadora) Para lpuntos que representan a los vendedores esta variable tiene valor de 0 y para los cuatro purepresentan a las vendedoras valdraacute 1 Los datos de entrada para nuestra regresioacuten con variticias se dan en la tabla 13-6

Para los datos de la tabla 13-6 se ajusta una regresioacuten de la forma

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

Uso de variablesficticias

Deteccioacuten depatrones en losresiduos

ldquoPresionar a losresiduosrdquo

Anaacutel i s i s de r e gr e s i oacuten

La ec uac i oacuten de r e gr es i oacuten esSALARI O ϭ 5 81 ϩ 0 233 MESES

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t pCons t a nt e 5 8093 0 4038 14 39 0 000MESES 0 23320 0 02492 9 36 0 000

s ϭ 0 5494 R- s q ϭ 92 6

Anaacute l i s i s de va r i a nz aFUENTE GL SC MC F Re gr e s i oacuten 1 26 443 24 443 87 61 0Er r or 7 2 113 0 302Tot a l 8 28 556

FIGURA 13-10

Regresioacuten conMinitab del salariobase sobre losmeses deantiguumledad

RENGLOacuteN SALARI O AJ UST1 RESI 1

1 7 5 7 2085 0 2914992 8 6 8 1413 0 458684

3 9 1 8 6077 0 4922764 10 3 10 0069 0 2930545 13 0 12 8054 0 1946076 6 2 6 9753 - 0 7752977 8 7 8 8409 - 0 1409288 9 4 9 3073 0 0926649 9 8 10 7066 - 0 906558

FIGURA 13-11

Tabla de residuosde Minitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2056

pezamos con n puntos y los usamos para estimar los dos coeficientes a y b Luego basamtras pruebas en la distribucioacuten t con n Ϫ 2 grados de libertad

De manera similar en la regresioacuten muacuteltiple tambieacuten empezamos con n puntos pero lospara estimar k ϩ 1 coeficientes la ordenada a y k pendientes b1 b2 bk Despueacutes estcientes se usan en la ecuacioacuten 13-6 para calcular se que de nuevo es una estimacioacuten de eviacioacuten estaacutendar de las variaciones de los datos (ecuacioacuten 13-7a) Luego se utiliza se (en ucioacuten que estaacute maacutes allaacute del alcance de este libro) para encontrar s

bi Debido a lo anterior

nuestras pruebas de hipoacutetesis en la distribucioacuten t con n Ϫ k Ϫ 1 (ϭ n Ϫ ( k ϩ l)) grados de En nuestro ejemplo el valor estandarizado del coeficiente de regresioacuten es

t ϭ

ϭ

ϭ 2432 larr Coeficiente de regresioacuten estandarizado

Suponga que estamos interesados en probar nuestras hipoacutetesis al nivel de significancia

Como tenemos 10 observaciones en la muestra y tres variables independientes sabemos n Ϫ k Ϫ 1 o 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad Buscamos en la tabla 2 del apeacutendice en lana de 10 y el rengloacuten de 6 grados de libertad Ahiacute vemos que el valor apropiado de t es 19mo nos preocupa si b1 (la pendiente del plano de regresioacuten de la muestra) es significativamferente de B1 (la pendiente hipoteacutetica del plano de regresioacuten de la poblacioacuten) eacutesta es una pdos colas y los valores criacuteticos son Ϯ1943 El coeficiente de regresioacuten estandarizado es 2se encuentra fuera de la regioacuten de aceptacioacuten de nuestra prueba de hipoacutetesis Por consiguichazamos la hipoacutetesis nula de que B1 todaviacutea es igual a 0400 En otras palabras existe unacia suficientemente grande entre b1 y 0400 para concluir que B1 ha cambiado respecto a histoacuterico Por esto sentimos que cada 100 horas adicionales de trabajo en auditoriacuteas de camaumentan la cantidad de descubrimientos de impuestos no pagados en $400000 como lo hel pasado

Ademaacutes de la prueba de hipoacutetesis podemos construir un intervalo de confianza para cude los valores de Bi Del mismo modo que bi es una estimacioacuten puntual de Bi estos intervalofianza son estimaciones de intervalo de Bi Para ilustrar el proceso de construccioacuten de interconfianza encontremos un intervalo de confianza del 95 para B3 en el ejemplo del IRS Lrelevantes son

b3 ϭ 0405 de la figura 13-2sb3 ϭ 00422

t ϭ 2447 larr Nivel de significancia del 5 y 6 grados de libertad

Intervalo deconfianza para B i

Realizacioacuten de la

prueba de hipoacutetesis

0597 ndash 0400ᎏᎏ

0081

b1 ndash B10ᎏ

sb1

Anaacute l i s i s de r e gr e s i oacutenLa ec uaci oacuten de r egr es i oacuten esDESCUBRE = - 45 0 + 0 597 AUDI TORIacute A + 1 18 COMPUTADORA + 0 405 RECOMPENSA

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 45 796 4 878 - 9 39 0 000AUDI TORIacute A 0 50697 0 08112 7 36 0 000COMPUTADORA 1 17684 0 08407 14 00 0 000RECOMPENSAS 0 40511 0 04223 9 59 0 000

s = 0 2861 R- s q = 98 3

FIGURA 13-2

Salida de Minitab(figura repetida)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2156

Con esta informacioacuten podemos calcular el intervalo de confianza de la siguiente manera

b3 ϩ t (sb3) ϭ 0405 ϩ 2447(00422)

ϭ 0508 larr Liacutemite superior

b3 Ϫ t (sb3) ϭ 0405 Ϫ 2447(00422)

ϭ 0302 larr Liacutemite inferior

Vemos que podemos tener una seguridad del 95 de que cada $1000 adicionales pagados a los formantes aumenta el descubrimiento de impuestos no pagados en una cantidad entre $302000$508000

A menudo estaremos interesados en preguntas del tipo iquesten realidad Y depende de X i Por ejeplo podriacuteamos preguntar si descubrir impuestos no pagados en realidad depende de las horas encomputadora Con frecuencia esta pregunta se plantea como iquestes X i una variable explicativa sigficativa de Y Si piensa un poco maacutes se convenceraacute de que si Bi 0 Y depende de las X i (esto esvariacutea cuando X i variacutea) y no depende de X i si Bi ϭ 0

Vemos que nuestra pregunta conduce a establecer hipoacutetesis de la forma

H0 Bi ϭ 0 larr Hipoacutetesis nula X i no es una variable explicativa significativa

H1 Bi 0 larr Hipoacutetesis alternativa X i es una variable explicativa significativa

Podemos probar estas hipoacutetesis utilizando la ecuacioacuten 13-8 del mismo modo que cuando probamnuestras hipoacutetesis acerca de si B1 todaviacutea era igual a 0400 Sin embargo existe una forma maacutes faacutede hacerlo usando la columna de la figura 13-2 de ldquocociente- t rdquo Observemos de nuevo la ecuaci13-8

t ϭ [13-

Como nuestro valor hipoteacutetico de Bi es cero el valor estandarizado del coeficiente de regresioacutedenotado por t o se convierte en

t o ϭ

El valor de t o se conoce como valor t ldquocalculadordquo Eacuteste es el nuacutemero que aparece en la columna equetada como ldquocociente-t rdquo en la figura 13-2 Denotemos por t c el valor t ldquocriacuteticordquo que buscamos

la tabla 2 del apeacutendice Entonces como la prueba para determinar si X i es una variable explicatisignificativa es una prueba de dos colas soacutelo necesitamos verificar si Ϫt c Յ t o Յ t c

Uso de valores t

calculados en lasalida de Minitab

biᎏ

sbi

bi ndash Bi0ᎏ

sbi

iquestEs significativa unavariable explicativa

Prueba para determinar si una variable es o no significativa

Ϫt c Յ t o Յ t c [13-9

donde

bull t c ϭ valor t adecuado (con n Ϫ k Ϫ 1 grados de libertad) para el nivel de significancia deprueba

bull t o ϭ bi sbi ϭ valor t observado (o calculado) obtenido con el paquete de software

Si t o

cae entre Ϫt c

y t c aceptamos H0 y llegamos a la conclusioacuten de que X

ino es una variable exp

cativa significativa En cualquier otro caso rechazamos H0 y concluimos que X i es una variable eplicativa significativa

Probemos al nivel de significancia de 001 si las horas en computadora constituyen una variabexplicativa significativa para los impuestos no pagados descubiertos De la tabla 2 del apeacutendice cn Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad y ϭ 001 vemos que t c ϭ 3707 De la figura 13tenemos que t o = 1400 Como t o Ͼ t c concluimos que el tiempo en computadora es una variab

Prueba de lasignificancia de lavariable horas decomputadora en elproblema del IRS

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2256

explicativa significativa De hecho al observar los valores t calculados para las otras dos vindependientes (tiempo de auditoriacuteas de campo t o ϭ 736 y recompensa a informantes t ovemos que tambieacuten son variables explicativas significativas

Podemos tambieacuten utilizar la columna de ldquoprdquo para probar si X i es una variable explicativacativa De hecho utilizando esa informacioacuten ni siquiera necesitamos usar la tabla 2 del aLos elementos de esta columna son los valores prob para las hipoacutetesis

H0 Biϭ 0

H1 Bi 0

Recuerde del anaacutelisis hecho en el capiacutetulo 9 que estos valores prob constituyen la probabque cada bi esteacute tan lejos de cero como (o maacutes) el valor observado obtenido de la regresioacutenverdadera Como se ilustra en la figura 13-3 solamente necesitamos comparar estos valocon el nivel de significancia de la prueba para determinar si X i es o no una variable expsignificativa para Y

Probar la significancia de una variable explicativa es siempre una prueba de dos colas Lble independiente X i es una variable explicativa significativa si bi es significativamente dife

cero es decir si t o es un nuacutemero grande positivo o negativoPara el ejemplo del IRS repetimos las pruebas con ϭ 001 Para cada una de las tres v

independientes p es menor que 001 de forma que podemos concluir que cada una de ellanificativa

Inferencias acerca de la regresioacuten como un todo

(usando una prueba F )

Suponga que cubre con papel un tablero para dardos y lanza varios dardos sobre eacutel Despueacuteberlo hecho tendraacute algo muy parecido a un diagrama de dispersioacuten Suponga entonces quuna recta de regresioacuten a este conjunto de ldquopuntos observadosrdquo y calcula r

2 Debido a que lofueron lanzados aleatoriamente usted espera obtener un valor bajo de r

2 puesto que en esten realidad no explica a Y Sin embargo si hace esto muchas veces ocasionalmente observalor alto de r

2 por pura casualidadDada cualquier regresioacuten simple (o muacuteltiple) es natural preguntarse si el valor de r2 (

realmente indica que las variables independientes explican a Y o si esto sucede por cas

A menudo esta interrogante se plantea de la siguiente manera iquestla regresioacuten como un todo ficativa En la uacuteltima seccioacuten vimos coacutemo decidir si una X i individual es una variable exp

Significancia de laregresioacuten comoun todo

FIGURA 13-3

Uso de ldquoprdquo paradeterminar si X i esuna variable expli-cativa significativa

Regioacuten de aceptacioacuten Regioacuten de aceptacioacuten

2 del aacuterea

2 del aacuterea

2 del aacuterea

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

ndasht c

ndasht o

t o

t c

0

(a) p es mayor que X

i no es una variable

explicativa significativa

(b) p es menor que X

i es una variable

explicativa significativa

ndasht o

ndasht c

t c

0

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2356

significativa ahora veremos coacutemo decidir si todas las X i tomadas en conjunto explican significavamente la variabilidad observada de Y Nuestras hipoacutetesis son

H0 B1 ϭ B2 ϭ ϭ Bk ϭ 0 larr Hipoacutetesis nula Y no depende de las X i

H1 por lo menos una Bi 0 larr Hipoacutetesis alternativa Y depende de al menos una de las X i

Cuando analizamos r 2 en el capiacutetulo 12 consideramos la variacioacuten total en Y sum(Y Ϫ Y ෆ )2 la p

te de dicha variacioacuten que explica la regresioacuten sum(Y ˆ Ϫ Y ෆ )2 y la parte no explicada de la variacioacutensum(Y Ϫ Y ˆ )2 La figura 13-4 es un duplicado de la figura 12-15 Sirve como repaso de la relacioacuten etre la desviacioacuten total la desviacioacuten explicada y la desviacioacuten no explicada para un solo dato en uregresioacuten simple Aunque no podamos dibujar una figura similar para una regresioacuten muacuteltiple coceptualmente estamos haciendo lo mismo

Al analizar la variacioacuten en Y fijamos nuestra atencioacuten en tres teacuterminos diferentes cada uno de cuales es una suma de cuadrados Los denotamos con

Suma de cuadradosy sus grados delibertad

Anaacutelisis de lavariacioacuten de losvalores Y

FIGURA 13-4

Desviacioacuten totaldesviacioacutenexplicada ydesviacioacuten noexplicada paraun valor observadode Y

Y

X

Un valor observado de lavariable dependiente (Y )

R e c t a d

e r e g r e s

i oacute n

Desviacioacuten no explicada de esta Y respectoa su media Y

(Y ndash Y )^

Desviacioacuten explicada deesta Y respecto a su media Y

(Y ndash Y )^Y

Valor estimado de esta Y

a partir de la recta de regresioacuten (Y )^

Desviacioacuten total de esta Y

respecto a su media Y

(Y ndash Y )

Tres sumas de cuadrados

SCT ϭ suma de cuadrados total (es decir la parte explicada) ϭ sum(Y Ϫ Y ෆ )2

SCR ϭ suma de cuadrados de la regresioacuten (es decir la parte explicada) ϭ sum(Y ˆ Ϫ Y ෆ )2 [13-10

SCE ϭ suma de cuadrados del error (es decir la parte no explicada) ϭ sum(Y Ϫ Y ˆ )2

Estaacuten relacionadas por la ecuacioacuten

que dice que la variacioacuten total en Y puede dividirse en dos partes la parte explicada y la no explicaCada una de estas sumas de cuadrados tiene un nuacutemero asociado de grados de libertad SCT t

ne n Ϫ 1 grados de libertad (n observaciones menos un grado de libertad debido a que la media la muestra estaacute fija) SCR tiene k grados de libertad porque existen k variables independientes qse utilizaron para explicar Y Finalmente SCE tiene n Ϫ k Ϫ 1 grados de libertad porque utilizamnuestras n observaciones para estimar k ϩ 1 constantes a b1 b2 bk Si la hipoacutetesis nula es ci

ta el cociente

Descomposicioacuten de la variacioacuten total de Y

SCT ϭ SCR ϩ SCE [13-1

Cociente F

F ϭ [13-12SCR k ᎏᎏ

SCE(n ndash k ndash 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2456

tiene una distribucioacuten F con k grados de libertad en el numerador y n Ϫ k Ϫ 1 grados de libel denominador Si la hipoacutetesis nula es falsa entonces el cociente tiende a ser maacutes grande qula hipoacutetesis nula es verdadera De modo que si el cociente F es demasiado grande (seguacuten lo na el nivel de significancia de la prueba y el valor apropiado de la tabla 6 del apeacutendice) rechH0 y concluimos que la regresioacuten como un todo es significativa

La figura 13-5 presenta la salida de Minitab para el problema del IRS Esta parte del rincluye los cocientes F calculados para la regresioacuten en ocasiones llamado anaacutelisis de v

(ANOVA) para la regresioacuten Probablemente se pregunte si esto tiene algo que ver con el anaacutelisrianza que estudiamos en el capiacutetulo 11 La respuesta es siacute Aunque no lo hicimos es posibletrar que el anaacutelisis de varianza visto en el capiacutetulo 11 tambieacuten contempla la variacioacuten total las observaciones alrededor de la gran media y la divide en dos partes una explicada por lascias entre los distintos grupos (que corresponde a lo que llamamos varianza entre columnas)

no explicada por dichas diferencias (que corresponde a la varianza dentro de columnas) Estcisamente anaacutelogo a lo que acabamos de hacer en la ecuacioacuten 13-11Para el problema del IRS vemos que SCR ϭ 29109 (con k ϭ 3 grados de libertad) SCE

(con n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad) y que

F ϭ ϭ ϭ 11833

Los elementos en la columna ldquoMCrdquo son justo las sumas de cuadrados divididas entre sus glibertad Para 3 grados de libertad en el numerador y 6 en el denominador la tabla 6 del apeacutence que 978 es el liacutemite superior de la regioacuten de aceptacioacuten para un nivel de significancia El valor calculado de F 11833 estaacute muy por arriba de 978 de manera que se ve que la r

como un todo es altamente significativa Se puede llegar a la misma conclusioacuten si se observresultado del programa dice que ldquo prdquo es 0000 Debido a que este valor prob es menor que elsignificancia ϭ 001 se concluye que la regresioacuten completa es significativa De esta mapuede usar la p de ANOVA como prueba sin tener que utilizar la tabla 6 del apeacutendice para bvalor criacutetico de F Esto es anaacutelogo a la manera en que se usaron los valores de p en la figura ra probar la significancia de las variables explicativas individuales

Multicolinealidad en la regresioacuten muacuteltiple

En el anaacutelisis de regresioacuten muacuteltiple los coeficientes de regresioacuten a menudo se vuelven

confiables conforme aumenta el grado de correlacioacuten entre las variables independie

existe un alto nivel de correlacioacuten entre algunas de las variables independientes nos enfrenun problema que los estadiacutesticos llaman multicolinealidad

La multicolinealidad puede presentarse si deseamos estimar la recuperacioacuten de las ventaempresa y utilizamos tanto el nuacutemero de vendedores empleados como sus salarios totales Cvalores asociados con estas dos variables independientes tienen una correlacioacuten alta neceusar soacutelo un conjunto de ellos para realizar nuestra estimacioacuten De hecho al agregar una segriable que estaacute correlacionada con la primera se distorsionan los valores de los coeficientgresioacuten Sin embargo a menudo podemos predecir bien Y incluso cuando haya multicoline

Consideremos un ejemplo donde existe multicolinealidad para ver coacutemo afecta a la regresrante los 12 meses pasados el gerente del restaurante Pizza Shack ha estado poniendo unaanuncios en el perioacutedico local Los anuncios se programan y pagan el mes anterior a que ap

Un ejemplo demulticolinealidad

Definicioacuten y efecto dela multicolinealidad

9703ᎏ

0082

29109 3ᎏ

0491 6Prueba de lasignificancia de laregresioacuten en elproblema del Serviciode Contribuciones

Anaacutelisis devarianza parala regresioacuten

Prueba F de laregresioacuten como

un todo

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 29 1088 9 7029 118 52 0Er r or 6 0 4912 0 0819Tot al 9 29 6000

FIGURA 13-5Salida de Minitabanaacutelisis devarianza

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2556

Cada anuncio contiene un cupoacuten que permite llevarse dos pizzas pagando solamente la de mcio El gerente recolectoacute los datos de la tabla 13-4 y le gustariacutea utilizarlos para predecir las vpizzas

En las figuras 13-6 y 13-7 se dieron los resultados de Minitab para las regresiones respelas ventas totales sobre el nuacutemero de anuncios y sobre el costo

Para la regresioacuten sobre el nuacutemero de anuncios tenemos que el valor t observado es 395grados de libertad y un nivel de significancia de ϭ 001 se encontroacute que el valor t criacuteticdo de la tabla 2 del apeacutendice) es 3169 Como t o Ͼ t c (o de manera equivalente como p es m001) concluimos que el nuacutemero de anuncios es una variable explicativa altamente signifilas ventas totales Note tambieacuten que r 2 ϭ 610 de modo que el nuacutemero de anuncios explximadamente el 61 de la variacioacuten en las ventas de pizzas

Para la regresioacuten sobre el costo de los anuncios el valor t observado es 454 de modo qude los anuncios es una variable explicativa de las ventas totales todaviacutea maacutes significativa que ro de anuncios (para los que el valor t observado fue soacutelo 395) En esta regresioacuten r 2 ϭ 673

el costo de los anuncios explica aproximadamente el 67 de la variacioacuten de las ventas de pizComo ambas variables explicativas son altamente significativas por siacute mismas intentam

zar ambas en una regresioacuten muacuteltiple El resultado se presenta en la figura 13-8La regresioacuten muacuteltiple es altamente significativa como un todo ya que la p de ANOVA e

Uso de ambas varia-bles explicativas enuna regresioacuten muacuteltiple

Dos regresionessimples

Datos de ventas y anun-cios para el restaurantePizza Shack

Tabla 13-4 X 1 X 2 Y

Nuacutemero Costo de anuncios Venta tode anuncios publicados de pizz

Mes publicados (cientos de doacutelares) (miles de d

Mayo 12 139 436

Junio 11 120 380

Julio 9 93 301

Agosto 7 97 353

Septiembre 12 123 464

Octubre 8 114 342

Noviembre 6 93 302

Diciembre 13 143 407

Enero 8 102 385

Febrero 6 84 226

Marzo 8 112 376

Abril 10 111 352

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esVENTAS = 16 9 + 2 08 ANUNCI OS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 16 937 4 982 3 40 0 007ANUNCI OS 2 0832 0 5271 3 95 0 003

s = 4 206 R- s q = 61 0

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 1 276 31 276 31 15 62 Er r or 10 176 88 17 69Tot a l 11 453 19

Figura 13-6

Regresioacuten de lasventas sobre elnuacutemero deanuncios conMinitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2656

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2756

gar el nuacutemero de anuncios como segunda variable explicativa ademaacutes del costo de los anuncios eplica nada maacutes alrededor del 1 adicional de la variacioacuten de las ventas totales

En este punto es justo preguntarse iquestqueacute variable realmente explica la variacioacuten de las ventotales en la regresioacuten muacuteltiple La respuesta es que ambas la explican pero no podemos separ

sus contribuciones individuales debido a que estaacuten altamente correlacionadas entre siacute E

consecuencia sus coeficientes en la regresioacuten muacuteltiple tienen errores estaacutendar altos valore

calculados relativamente bajos y valores prob Ͼ | t | relativamente altos

iquestDe queacute manera nos afecta esta multicolinealidad Todaviacutea podemos hacer predicciones relativmente precisas cuando se encuentra presente note que para la regresioacuten muacuteltiple (la salida se dala figura 13-8) el error estaacutendar de la estimacioacuten que determina el ancho de los intervalos de co

fianza para las predicciones es 3989 mientras que para la regresioacuten simple con el costo de los anucios como variable explicativa (salida en la figura 13-7) tenemos se ϭ 3849 Lo que no podemhacer es predecir con mucha precisioacuten coacutemo cambiaraacuten las ventas si aumentamos en uno el nuacutemede anuncios La regresioacuten muacuteltiple dice que b1 ϭ 0625 (esto es cada anuncio aumenta las ventotales de pizzas alrededor de $625) pero el error estaacutendar de este coeficiente es 112 (es decir apximadamente $1120)

Las contribucionesindividuales nopueden separarse

Ejercicios 134

Ejercicios de autoevaluacioacuten

EA 13-4 Edith Pratt es una ocupada ejecutiva de una compantildeiacutea de transporte de carga a nivel nacional y va tara una junta porque no encuentra la salida de la regresioacuten muacuteltiple elaborada por un asistente Si la regsioacuten total es significativa al nivel 005 ella desea usar las salida de computadora como evidencia para fudamentar algunas ideas que expondraacute en la reunioacuten Sin embargo su ayudante estaacute enfermo De hectoda la informacioacuten que tiene de la regresioacuten muacuteltiple es un trozo de papel con los siguientes datos

Regresioacuten paraEdith Pratt

SCR 8724 con gl

SCE con 17 gl

SCT 10236 con 24 gl

Como el papel ni siquiera tiene todos los nuacutemeros Edith ha concluido que no es uacutetil Usted sin embardebe saber maacutes que ella iquestPuede Edith entrar en la junta o debe seguir buscando la salida de computador

EA 13-5 Una pequentildea liacutenea aeacuterea de Nueva Inglaterra realizoacute una encuesta sobre sus 15 terminales y obtuvo losguientes datos para el mes de febrero donde

VENTAS ϭ ingreso total seguacuten el nuacutemero de boletos vendidos (en miles de doacutelares)

PROMOCϭ cantidad gastada en promociones de la liacutenea aeacuterea en el aacuterea (en miles de doacutelares)

COMPET ϭ nuacutemero de liacuteneas aeacutereas que compiten en esa terminal

GRATIS ϭ nuacutemero de pasajeros que vuelan gratis (por diferentes razones)

Sugerencia el concepto de hacer infe-rencias respecto a una regresioacuten muacutelti-ple es justo lo mismo que se hizo en elcapiacutetulo 12 cuando hicimos inferencias

respecto a una recta de regresioacuten excepto que ahora se em-

plean dos o maacutes variables independientes Advertencia lamulticolinealidad es un problema que debe manejarse enla regresioacuten muacuteltiple y es necesario desarrollar una com-prensioacuten con sentido comuacuten Recuerde que todaviacutea puedehacer predicciones precisas cuando estaacute presente Pero re-cuerde tambieacuten que no puede decir con mucha precisioacuten

cuaacutento cambiaraacute la variable dependiente si ldquomanipulardquo lavariables independientes Entonces el objetivo debe seminimizar la multicolinealidad Sugerencia la mejor regresioacuten muacuteltiple es la que explica la relacioacuten entre los datos asentildealar la responsabilidad de la mayor proporcioacuten de la va

riacioacuten en la variable dependiente con el menor nuacutemero dvariables independientes Advertencia no es una buenidea incluir demasiadas variables independientes soacutelo porque cuenta con una computadora y un paquete de softwarpara estadiacutestica

SUGERENCIAS

Y

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2856

Ventas (doacutelares) Promoc (doacutelares) Compet Gratis

793 25 10 3

2001 55 8 6

1632 60 12 9

2001 79 7 16

1460 52 8 15

1777 76 12 9

309 20 12 8

2919 90 5 10

1600 40 8 43394 96 5 16

1596 55 11 7

863 30 12 6

2375 60 6 10

1072 50 10 4

1550 35 10 4

a) Utilice la siguiente salida de Minitab para determinar la ecuacioacuten de regresioacuten que mejor se ara la liacutenea aeacuterea

La ec uaci oacuten de r egr es i oacuten esVENTAS ϭ 172 ϩ 25 9 PROMOVϪ 13 2 COMPET Ϫ 3 04 GRATI S

Pr onos t i cador Coef Des vEs t Coci ent e - t Cons t ant e 172 34 51 38 3 35 0PROMOV 25 950 4 877 5 32 0COMPET - 13 238 3 686 - 3 59 0GRATI S - 3 041 2 342 - 1 30 0

b) iquestLos pasajeros que vuelan gratis ocasionan una disminucioacuten significativa en las ventas Fpruebe las hipoacutetesis apropiadas Use ϭ 005

c) iquestUn incremento de $1000 en las promociones cambia las ventas en $28000 o el cambio ecativamente diferente de $28000 Formule y pruebe las hipoacutetesis adecuadas Use ϭ 010

d) Calcule un intervalo de confianza del 90 para el coeficiente de la pendiente de la COMPET

Aplicaciones

13-22 Mark Lowtown publica el perioacutedico Mosquito Junction Enquirer y tiene problemas para predectidad de papel perioacutedico que necesita imprimir diariamente Eligioacute aleatoriamente 27 diacuteas del arior y registroacute la siguiente informacioacuten

PESO ϭ peso en libras de papel perioacutedico para la edicioacuten de ese diacutea

CLASIFICADOS ϭ nuacutemero de anuncios clasificados

PUBLICIDAD ϭ nuacutemero de anuncios publicitarios

PLANA COMPLETA ϭ nuacutemero de anuncios a una plana

Utilizando Minitab para hacer una regresioacuten de PESO sobre las otras tres variables Mark obtuguiente salida

Pr onos t i cador Coef Des vEs t Coci ent e- t Cons t ant e 1072 95 872 43 1 23 0CLASI FI CADOS 0 251 0 126 1 99 0PUBLI CI DAD 1 250 0 884 1 41 0PLANA COMPLETA 250 66 67 92 3 69 0

a) Mark siempre ha pensado que cada anuncio publicitario utiliza al menos 3 libras de papel iquestsioacuten le da una razoacuten significativa para dudar esto al nivel del 5

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2956

b) De manera similar Mark siempre ha creiacutedo que cada anuncio clasificado utiliza aproximmedia libra de papel iquestTiene ahora Mark una razoacuten significativa para dudar esto al nivel del

c) Mark vende espacios de anuncios de plana completa a los comerciantes locales a $30 la paacutegberaacute pensar en ajustar sus tarifas si el papel perioacutedico le cuesta $009 por libra Suponga costos son despreciables Establezca expliacutecitamente las hipoacutetesis y una conclusioacuten (Sugere

jando todo lo demaacutes constante cada anuncio adicional de plana completa tiene un costo de bras de papel ϫ $009 por libra ϭ $2256 El punto de equilibrio es 333333 libras iquestPor quel coeficiente de pendiente para PLANA COMPLETA es significativamente mayor que Mark no estaacute obteniendo ganancias y debe cambiar sus tarifas)

13-23 Para los datos del ejercicio 13-18 y un nivel de significancia de 010 iquestcuaacuteles variables son sign

mente explicativas de los resultados de los exaacutemenes (Habiacutea 12 estudiantes en la muestra) 13-24 Para los datos del ejercicio 13-18 y la siguiente salida de Minitab del procedimiento de regresiple hecho por Bill

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 3134 42 783 60Er r or 7 951 25 135 89Tot a l 11 4085 67

a) iquestCuaacutel es el valor observado de F b) A un nivel de significancia de 005 iquestcuaacutel es el valor criacutetico de F que se debe utilizar para d

si la regresioacuten como un todo es significativac) Basaacutendose en las respuestas a los incisos a) y b) iquestes la regresioacuten significativa como un tod

13-25 Remiacutetase al ejercicio 13-19 A un nivel de significancia de 001 iquestes la variable DISTANCIA uble explicativa significativa para VENTAS

13-26 Para los datos del ejercicio 13-19 y la siguiente salida adicional de Minitab al correr la regresioacuten

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 2861495 715374 102 39 0Er r or 18 125761 6896 7Tot a l 22 2987256

Al nivel de significancia de 005 iquestes la regresioacuten significativa como un todo

13-27 Henry Lander es el director de produccioacuten de la Alecos Corporation de Caracas Venezuela Hede que le ayude a determinar una foacutermula para predecir el ausentismo de los empacadores de chipoacutetesis es que la temperatura diaria promedio puede explicar el porcentaje de ausentismo Durios meses reuacutene datos ejecuta el procedimiento de regresioacuten simple y encuentra que la tempeplica 66 de la variacioacuten en el ausentismo Pero Henry no estaacute convencido de que eacuteste sea un cador satisfactorio Sugiere que la precipitacioacuten pluvial diaria podriacutea tambieacuten tener algo que vausentismo de modo que registra los datos correspondientes y hace una regresioacuten del ausentismte el tiempo de lluvias y obtiene un valor R2 de 059 ldquoiexclEurekardquo grita usted ldquoiexclLo tengo Con uticador que explica 66 y otro que explica 59 todo lo que tengo que hacer es una regresioacutenutilizando ambos y seguramente tendreacute un pronosticador casi perfectordquo Para su desaacutenimo sin la regresioacuten muacuteltiple tiene una R

2 de soacutelo 68 que es solamente un poco mejor que la variablperatura sola iquestCoacutemo puede explicar esta aparente discrepancia

13-28 Juan Armenlegg administrador de Rockyrsquos Diamond y Jewelry Store estaacute interesado en desamodelo para estimar la demanda del consumidor para su costosa mercanciacutea Como la mayoriacutea de

tes compran diamantes y joyas a creacutedito Juan estaacute seguro de que dos factores que deben influirmanda de los clientes son la tasa real de inflacioacuten anual y la tasa real de intereses sobre preacutestamprincipales bancos del paiacutes Explique algunos problemas que Juan podriacutea encontrar si fuera a dun modelo de regresioacuten basado en estas dos variables de prediccioacuten

13-29 Un nuevo programa de juegos Check That Model pide a los concursantes que especifiquen el nuacutenimo de paraacutemetros que necesitan para determinar si un modelo de regresioacuten muacuteltiple es signifimo un todo para ϭ 001 Usted ganoacute la apuesta con 4 paraacutemetros Use la siguiente informacioacutenterminar si la regresioacuten es significativa

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3056

R 2

ϭ 07452

SCE ϭ 1254

n ϭ 18

Nuacutemero de variables independientes ϭ 3

13-30 La Scottish Turist Agency estaacute interesada en el nuacutemero de turistas que entran al paiacutes cada semanrante la temporada alta Se recolectaron los siguientes datos

Turistas (Y ) ϭ nuacutemero de turistas que entran a Escocia en una semana (en miles)

Cambio (X 1)ϭ nuacutemero de libras escocesas compradas por $1 doacutelar

Precio (X 2) ϭ nuacutemero de libras escocesas cobradas por viaje redondo en camioacuten de Londres a Edimburgo

Promoc (X 3) ϭ cantidad gastada en promocioacuten del paiacutes (en miles de libras escocesas)Temp (X 4) ϭ temperatura media durante la semana en Edimburgo (en grados Celsius)

Turistas (Y ) Cambio (X 1) Precio (X 2) Promoc (X 3) Temp (X 4)

69 061 40 87 154

71 059 40 88 156

68 063 40 85 154

79 061 35 86 153

76 060 35 94 158

82 065 35 99 162

80 058 35 98 164

84 059 35 102 166

97 061 30 114 174

98 062 30 116 172

72 057 40 84 176

67 055 40 86 164

a) Utilice el paquete de software que tenga para determinar la ecuacioacuten de regresioacuten que mejote a los datos de la agencia de turismo

b) iquestEs la tasa de cambio una variable explicativa significativa Establezca y pruebe las hipoacutetesidas a un nivel de significancia de 010

c) Un incremento de 1000 libras en las promociones iquestaumenta el nuacutemero de turistas en maacutesEstablezca y pruebe las hipoacutetesis adecuadas para un nivel de significancia de 005

d) Calcule un intervalo de confianza del 95 para el coeficiente de la pendiente de Temp

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-4 Como SCT ϭ SCR ϩ SCE SCE ϭ SCT Ϫ SCR ϭ 10236 Ϫ 8724 ϭ 1512Como gl SCT ϭ gl SCR ϩ gl SCE gl SCR ϭ gl SCT Ϫ gl SCE ϭ 24 Ϫ 17 ϭ 7

Entonces F ϭ ϭ ϭ 1401

F CRiacuteT ϭ F (7 17 005) ϭ 261Como F OBS gt F CRIacuteT se concluye que la regresioacuten es significativa como un todo Edith debe conticando la salida de computadora de la regresioacuten para usarla en la junta

EA 13-5 De la salida de computadora se obti enen los siguientes resultadosa) VENTAS ϭ 17234 ϩ 25950PROMOC Ϫ13238COMPET Ϫ 3041GRATISb) H0 BGRATIS ϭ 0 H1 BGRATIS Ͻ 0 ϭ 005

Eacutesta es una prueba de una cola y el valor prob en los resultados es para la alternativa de dos c BGRATIS 0 De manera que para esta prueba el valor prob es 02212 ϭ 0111 Ͼ ϭ 00que no se puede rechazar H0 las ventas no disminuyen significativamente cuando aumenta ro de pasajeros que vuelan gratis

c) H0 BPROMOC ϭ 28 H1 BPROMOC 28 ϭ 010

87247ᎏᎏ

151217SCRk ᎏᎏ

SCE(n Ϫ k Ϫ 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3156

El valor observado t de los resultados de regresioacuten es

ϭ ϭ Ϫ0420

Con 11 grados de libertad y ϭ 010 en ambas colas combinadas los valores criacuteticos t parba son Ϯ1796 asiacute el valor observado estaacute dentro de la regioacuten de aceptacioacuten No se rechacambio en VENTAS para un incremento de una unidad ($1000) en PROMOC no es significate diferente de 28 ($28000)

d) Con 11 grados de libertad el valor t para un intervalo del 90 de confianza es 1796 por lo

tervalo esbCOMP Ϯ 1796sbCOMP

ϭ Ϫ13238 Ϯ 1796(3686)

ϭ Ϫ13238 Ϯ 6620 ϭ (Ϫ19858 Ϫ 6618)

La liacutenea aeacuterea puede tener una seguridad del 90 de que el ingreso por los boletos en una ofminuye entre $6600 y $19900 aproximadamente con cada liacutenea aeacuterea adicional que comp

135 Teacutecnicas de modelado

Dada una variable que deseamos explicar y un conjunto de variables explicativas potencialehaya varias ecuaciones de regresioacuten diferentes que podamos estudiar dependiendo de queacute explicativas incluyamos y de coacutemo lo hagamos Cada una de esas ecuaciones de regresioacutence como modelo Las teacutecnicas de modelado son las distintas formas en que podemos incluriables explicativas y verificar queacute tan apropiados son los modelos de regresioacuten Existen municas de modelado diferentes pero soacutelo veremos dos de las maacutes utilizadas

Datos cualitativos y variables ficticias

En todos los ejemplos de regresioacuten que hemos visto hasta ahora los datos manejados hanmeacutericos o cuantitativos Pero ocasionalmente nos enfrentaremos con una variable categoacuterilitativa En el problema del inicio el capiacutetulo el director de personal desea ver si el salarioun vendedor depende de su sexo En la tabla 13-5 repetimos los datos de dicho problema

Por el momento ignore la antiguumledad y utilice la teacutecnica desarrollada en el capiacutetulo 9 bar la diferencia entre las medias de dos poblaciones para ver si los hombres ganan maacutes qu

jeres Pruebe con ϭ 001 Si tomamos a los hombres como la poblacioacuten 1 y a las mujerespoblacioacuten 2 probaremos las siguientes hipoacutetesis

H0 1 ϭ 2 larr Hipoacutetesis nula no existe discriminacioacuten por sexo en los salarios base

H1 1 Ͼ 2 larr Hipoacutetesis alternativa se discrimina a las mujeres en su salario base

ϭ 001 larr Nivel de significancia

Revisioacuten del enfoqueanterior del problema

Buacutesqueda dediferentes modelos

25950 Ϫ 28ᎏᎏ

4877

(bPROMOC Ϫ 28)ᎏᎏ

sbPROMOC

Datos para el problemade discriminacioacuten porsexo

Tabla 13-5 Vendedores VendedorasAntiguumledad Salario base Antiguumledad Salario base(en meses) (en miles) (en meses) (en miles)

6 75 5 62

10 86 13 87

12 91 15 94

18 103 21 98

30 130

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3256

A continuacioacuten bosquejamos el anaacutelisis Si tiene problemas para seguirlo deberaacute repasamente la seccioacuten 93

n1 ϭ 5 n2 ϭ 4

x ෆ1 ϭ 97 x ෆ2 ϭ 8525

s2

1 ϭ 4415 s2

2 ϭ 2609

s2

p ϭ

ϭ

ϭ 3641

x ෆ1Ϫ x

ෆ2ϭ s pΊ ϩ

ϭ 128

t ϭ

ϭ

ϭ 092

Con siete grados de libertad el valor t criacutetico para una prueba de cola superior con ϭ 001 eComo el valor t observado de 092 es menor que 2998 no podemos rechazar H0

Entonces el anaacutelisis concluye que no parece haber discriminacioacuten por sexo en los salarPero recuerde que hasta ahora se han ignorado los datos de antiguumledad laboral para el anaacuteli

Antes de seguir vea el diagrama de dispersioacuten de los datos En la figura 13-9 los punto

corresponden a los hombres y los blancos a las mujeres El diagrama de dispersioacuten muestraridad que el salario base aumenta con los antildeos de antiguumledad pero si con la mirada sigue lo qla recta de regresioacuten notaraacute que los puntos negros tienden a estar arriba de ella y los blancos

La figura 13-10 da la salida de una regresioacuten del salario base sobre los meses de antiguumlelos resultados se ve que la antiguumledad es una variable explicativa altamente significativa

Ademaacutes r 2

ϭ 926 que indica que la variable meses de antiguumledad explica cerca del 9variacioacuten en el salario base La figura 13-11 contiene parte de la salida que no se vio antesbla de residuos Para cada punto el residuo es simplemente Y Ϫ Y ˆ que se reconoce como el

Una ldquomiradardquo a los

datos

El enfoque anterior nodetecta discriminacioacuten

(97 ndash 8525) ndash 0ᎏᎏ

128

( x ෆ1 ndash x ෆ2) ndash (1 Ϫ 2)H0

ᎏᎏᎏ

ˆ x ෆ1Ϫ

x ෆ2

1ᎏ

n2

1ᎏ

n1

4(4415) ϩ 3(2609)ᎏᎏᎏ5 ϩ 4 ndash 2

(n1 ndash 1)s21 ϩ (n2 ndash 1)s22ᎏᎏᎏ

n1 ϩ n2 ndash 2

FIGURA 13-9

Diagrama de dis-persioacuten de salariosbase contra mesesde antiguumledad

4 8 12 16 20 24 28

4

8

12

Meses de antiguumledad

S a l a r i o ( m i l e s d e d oacute l a r e s )

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3356

el ajuste de la recta de regresioacuten en ese punto En la figura 13-11 AJUST1 son los valores y RESI1 son los residuos

Tal vez la parte maacutes importante del anaacutelisis del resultado de una regresioacuten sea estusiduos Si la regresioacuten incluye todos los factores explicativos relevantes estos residuo

ser aleatorios Dicho de otro modo si los residuos muestran cualquier patroacuten no aleat

to indica que hay algo sistemaacutetico que afecta el proceso y que no hemos tomado en cu

manera que buscamos patrones en los residuos o para decirlo de forma maacutes pintoresca ldquopmos a los residuos hasta hacerlos hablarrdquo

Si observamos los residuos presentados en la figura 13-11 vemos que los primeros cincoson positivos De modo que para los vendedores tenemos Y ndash Y ˆ Ͼ 0 o Y Ͼ Y ˆ es decir laregresioacuten cae abajo de estos cinco puntos Tres de los cuatro uacuteltimos residuos son negaticonsiguiente para las vendedoras tenemos Y Ϫ Y ˆ Ͻ 0 o Y Ͻ Y ˆ asiacute que la recta de regresicuentra arriba de tres de los cuatro puntos Esto confirma lo que vimos al observar el diagdispersioacuten de la figura 13-9 Este patroacuten no aleatorio en los residuos sugiere que el sexo siacute etor determinante del salario base

iquestCoacutemo podemos incorporar el sexo de los vendedores dentro del modelo de regresioacutencemos utilizando un dispositivo llamado variable ficticia (o variable indicadora) Para lpuntos que representan a los vendedores esta variable tiene valor de 0 y para los cuatro purepresentan a las vendedoras valdraacute 1 Los datos de entrada para nuestra regresioacuten con variticias se dan en la tabla 13-6

Para los datos de la tabla 13-6 se ajusta una regresioacuten de la forma

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

Uso de variablesficticias

Deteccioacuten depatrones en losresiduos

ldquoPresionar a losresiduosrdquo

Anaacutel i s i s de r e gr e s i oacuten

La ec uac i oacuten de r e gr es i oacuten esSALARI O ϭ 5 81 ϩ 0 233 MESES

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t pCons t a nt e 5 8093 0 4038 14 39 0 000MESES 0 23320 0 02492 9 36 0 000

s ϭ 0 5494 R- s q ϭ 92 6

Anaacute l i s i s de va r i a nz aFUENTE GL SC MC F Re gr e s i oacuten 1 26 443 24 443 87 61 0Er r or 7 2 113 0 302Tot a l 8 28 556

FIGURA 13-10

Regresioacuten conMinitab del salariobase sobre losmeses deantiguumledad

RENGLOacuteN SALARI O AJ UST1 RESI 1

1 7 5 7 2085 0 2914992 8 6 8 1413 0 458684

3 9 1 8 6077 0 4922764 10 3 10 0069 0 2930545 13 0 12 8054 0 1946076 6 2 6 9753 - 0 7752977 8 7 8 8409 - 0 1409288 9 4 9 3073 0 0926649 9 8 10 7066 - 0 906558

FIGURA 13-11

Tabla de residuosde Minitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2156

Con esta informacioacuten podemos calcular el intervalo de confianza de la siguiente manera

b3 ϩ t (sb3) ϭ 0405 ϩ 2447(00422)

ϭ 0508 larr Liacutemite superior

b3 Ϫ t (sb3) ϭ 0405 Ϫ 2447(00422)

ϭ 0302 larr Liacutemite inferior

Vemos que podemos tener una seguridad del 95 de que cada $1000 adicionales pagados a los formantes aumenta el descubrimiento de impuestos no pagados en una cantidad entre $302000$508000

A menudo estaremos interesados en preguntas del tipo iquesten realidad Y depende de X i Por ejeplo podriacuteamos preguntar si descubrir impuestos no pagados en realidad depende de las horas encomputadora Con frecuencia esta pregunta se plantea como iquestes X i una variable explicativa sigficativa de Y Si piensa un poco maacutes se convenceraacute de que si Bi 0 Y depende de las X i (esto esvariacutea cuando X i variacutea) y no depende de X i si Bi ϭ 0

Vemos que nuestra pregunta conduce a establecer hipoacutetesis de la forma

H0 Bi ϭ 0 larr Hipoacutetesis nula X i no es una variable explicativa significativa

H1 Bi 0 larr Hipoacutetesis alternativa X i es una variable explicativa significativa

Podemos probar estas hipoacutetesis utilizando la ecuacioacuten 13-8 del mismo modo que cuando probamnuestras hipoacutetesis acerca de si B1 todaviacutea era igual a 0400 Sin embargo existe una forma maacutes faacutede hacerlo usando la columna de la figura 13-2 de ldquocociente- t rdquo Observemos de nuevo la ecuaci13-8

t ϭ [13-

Como nuestro valor hipoteacutetico de Bi es cero el valor estandarizado del coeficiente de regresioacutedenotado por t o se convierte en

t o ϭ

El valor de t o se conoce como valor t ldquocalculadordquo Eacuteste es el nuacutemero que aparece en la columna equetada como ldquocociente-t rdquo en la figura 13-2 Denotemos por t c el valor t ldquocriacuteticordquo que buscamos

la tabla 2 del apeacutendice Entonces como la prueba para determinar si X i es una variable explicatisignificativa es una prueba de dos colas soacutelo necesitamos verificar si Ϫt c Յ t o Յ t c

Uso de valores t

calculados en lasalida de Minitab

biᎏ

sbi

bi ndash Bi0ᎏ

sbi

iquestEs significativa unavariable explicativa

Prueba para determinar si una variable es o no significativa

Ϫt c Յ t o Յ t c [13-9

donde

bull t c ϭ valor t adecuado (con n Ϫ k Ϫ 1 grados de libertad) para el nivel de significancia deprueba

bull t o ϭ bi sbi ϭ valor t observado (o calculado) obtenido con el paquete de software

Si t o

cae entre Ϫt c

y t c aceptamos H0 y llegamos a la conclusioacuten de que X

ino es una variable exp

cativa significativa En cualquier otro caso rechazamos H0 y concluimos que X i es una variable eplicativa significativa

Probemos al nivel de significancia de 001 si las horas en computadora constituyen una variabexplicativa significativa para los impuestos no pagados descubiertos De la tabla 2 del apeacutendice cn Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad y ϭ 001 vemos que t c ϭ 3707 De la figura 13tenemos que t o = 1400 Como t o Ͼ t c concluimos que el tiempo en computadora es una variab

Prueba de lasignificancia de lavariable horas decomputadora en elproblema del IRS

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2256

explicativa significativa De hecho al observar los valores t calculados para las otras dos vindependientes (tiempo de auditoriacuteas de campo t o ϭ 736 y recompensa a informantes t ovemos que tambieacuten son variables explicativas significativas

Podemos tambieacuten utilizar la columna de ldquoprdquo para probar si X i es una variable explicativacativa De hecho utilizando esa informacioacuten ni siquiera necesitamos usar la tabla 2 del aLos elementos de esta columna son los valores prob para las hipoacutetesis

H0 Biϭ 0

H1 Bi 0

Recuerde del anaacutelisis hecho en el capiacutetulo 9 que estos valores prob constituyen la probabque cada bi esteacute tan lejos de cero como (o maacutes) el valor observado obtenido de la regresioacutenverdadera Como se ilustra en la figura 13-3 solamente necesitamos comparar estos valocon el nivel de significancia de la prueba para determinar si X i es o no una variable expsignificativa para Y

Probar la significancia de una variable explicativa es siempre una prueba de dos colas Lble independiente X i es una variable explicativa significativa si bi es significativamente dife

cero es decir si t o es un nuacutemero grande positivo o negativoPara el ejemplo del IRS repetimos las pruebas con ϭ 001 Para cada una de las tres v

independientes p es menor que 001 de forma que podemos concluir que cada una de ellanificativa

Inferencias acerca de la regresioacuten como un todo

(usando una prueba F )

Suponga que cubre con papel un tablero para dardos y lanza varios dardos sobre eacutel Despueacuteberlo hecho tendraacute algo muy parecido a un diagrama de dispersioacuten Suponga entonces quuna recta de regresioacuten a este conjunto de ldquopuntos observadosrdquo y calcula r

2 Debido a que lofueron lanzados aleatoriamente usted espera obtener un valor bajo de r

2 puesto que en esten realidad no explica a Y Sin embargo si hace esto muchas veces ocasionalmente observalor alto de r

2 por pura casualidadDada cualquier regresioacuten simple (o muacuteltiple) es natural preguntarse si el valor de r2 (

realmente indica que las variables independientes explican a Y o si esto sucede por cas

A menudo esta interrogante se plantea de la siguiente manera iquestla regresioacuten como un todo ficativa En la uacuteltima seccioacuten vimos coacutemo decidir si una X i individual es una variable exp

Significancia de laregresioacuten comoun todo

FIGURA 13-3

Uso de ldquoprdquo paradeterminar si X i esuna variable expli-cativa significativa

Regioacuten de aceptacioacuten Regioacuten de aceptacioacuten

2 del aacuterea

2 del aacuterea

2 del aacuterea

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

ndasht c

ndasht o

t o

t c

0

(a) p es mayor que X

i no es una variable

explicativa significativa

(b) p es menor que X

i es una variable

explicativa significativa

ndasht o

ndasht c

t c

0

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2356

significativa ahora veremos coacutemo decidir si todas las X i tomadas en conjunto explican significavamente la variabilidad observada de Y Nuestras hipoacutetesis son

H0 B1 ϭ B2 ϭ ϭ Bk ϭ 0 larr Hipoacutetesis nula Y no depende de las X i

H1 por lo menos una Bi 0 larr Hipoacutetesis alternativa Y depende de al menos una de las X i

Cuando analizamos r 2 en el capiacutetulo 12 consideramos la variacioacuten total en Y sum(Y Ϫ Y ෆ )2 la p

te de dicha variacioacuten que explica la regresioacuten sum(Y ˆ Ϫ Y ෆ )2 y la parte no explicada de la variacioacutensum(Y Ϫ Y ˆ )2 La figura 13-4 es un duplicado de la figura 12-15 Sirve como repaso de la relacioacuten etre la desviacioacuten total la desviacioacuten explicada y la desviacioacuten no explicada para un solo dato en uregresioacuten simple Aunque no podamos dibujar una figura similar para una regresioacuten muacuteltiple coceptualmente estamos haciendo lo mismo

Al analizar la variacioacuten en Y fijamos nuestra atencioacuten en tres teacuterminos diferentes cada uno de cuales es una suma de cuadrados Los denotamos con

Suma de cuadradosy sus grados delibertad

Anaacutelisis de lavariacioacuten de losvalores Y

FIGURA 13-4

Desviacioacuten totaldesviacioacutenexplicada ydesviacioacuten noexplicada paraun valor observadode Y

Y

X

Un valor observado de lavariable dependiente (Y )

R e c t a d

e r e g r e s

i oacute n

Desviacioacuten no explicada de esta Y respectoa su media Y

(Y ndash Y )^

Desviacioacuten explicada deesta Y respecto a su media Y

(Y ndash Y )^Y

Valor estimado de esta Y

a partir de la recta de regresioacuten (Y )^

Desviacioacuten total de esta Y

respecto a su media Y

(Y ndash Y )

Tres sumas de cuadrados

SCT ϭ suma de cuadrados total (es decir la parte explicada) ϭ sum(Y Ϫ Y ෆ )2

SCR ϭ suma de cuadrados de la regresioacuten (es decir la parte explicada) ϭ sum(Y ˆ Ϫ Y ෆ )2 [13-10

SCE ϭ suma de cuadrados del error (es decir la parte no explicada) ϭ sum(Y Ϫ Y ˆ )2

Estaacuten relacionadas por la ecuacioacuten

que dice que la variacioacuten total en Y puede dividirse en dos partes la parte explicada y la no explicaCada una de estas sumas de cuadrados tiene un nuacutemero asociado de grados de libertad SCT t

ne n Ϫ 1 grados de libertad (n observaciones menos un grado de libertad debido a que la media la muestra estaacute fija) SCR tiene k grados de libertad porque existen k variables independientes qse utilizaron para explicar Y Finalmente SCE tiene n Ϫ k Ϫ 1 grados de libertad porque utilizamnuestras n observaciones para estimar k ϩ 1 constantes a b1 b2 bk Si la hipoacutetesis nula es ci

ta el cociente

Descomposicioacuten de la variacioacuten total de Y

SCT ϭ SCR ϩ SCE [13-1

Cociente F

F ϭ [13-12SCR k ᎏᎏ

SCE(n ndash k ndash 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2456

tiene una distribucioacuten F con k grados de libertad en el numerador y n Ϫ k Ϫ 1 grados de libel denominador Si la hipoacutetesis nula es falsa entonces el cociente tiende a ser maacutes grande qula hipoacutetesis nula es verdadera De modo que si el cociente F es demasiado grande (seguacuten lo na el nivel de significancia de la prueba y el valor apropiado de la tabla 6 del apeacutendice) rechH0 y concluimos que la regresioacuten como un todo es significativa

La figura 13-5 presenta la salida de Minitab para el problema del IRS Esta parte del rincluye los cocientes F calculados para la regresioacuten en ocasiones llamado anaacutelisis de v

(ANOVA) para la regresioacuten Probablemente se pregunte si esto tiene algo que ver con el anaacutelisrianza que estudiamos en el capiacutetulo 11 La respuesta es siacute Aunque no lo hicimos es posibletrar que el anaacutelisis de varianza visto en el capiacutetulo 11 tambieacuten contempla la variacioacuten total las observaciones alrededor de la gran media y la divide en dos partes una explicada por lascias entre los distintos grupos (que corresponde a lo que llamamos varianza entre columnas)

no explicada por dichas diferencias (que corresponde a la varianza dentro de columnas) Estcisamente anaacutelogo a lo que acabamos de hacer en la ecuacioacuten 13-11Para el problema del IRS vemos que SCR ϭ 29109 (con k ϭ 3 grados de libertad) SCE

(con n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad) y que

F ϭ ϭ ϭ 11833

Los elementos en la columna ldquoMCrdquo son justo las sumas de cuadrados divididas entre sus glibertad Para 3 grados de libertad en el numerador y 6 en el denominador la tabla 6 del apeacutence que 978 es el liacutemite superior de la regioacuten de aceptacioacuten para un nivel de significancia El valor calculado de F 11833 estaacute muy por arriba de 978 de manera que se ve que la r

como un todo es altamente significativa Se puede llegar a la misma conclusioacuten si se observresultado del programa dice que ldquo prdquo es 0000 Debido a que este valor prob es menor que elsignificancia ϭ 001 se concluye que la regresioacuten completa es significativa De esta mapuede usar la p de ANOVA como prueba sin tener que utilizar la tabla 6 del apeacutendice para bvalor criacutetico de F Esto es anaacutelogo a la manera en que se usaron los valores de p en la figura ra probar la significancia de las variables explicativas individuales

Multicolinealidad en la regresioacuten muacuteltiple

En el anaacutelisis de regresioacuten muacuteltiple los coeficientes de regresioacuten a menudo se vuelven

confiables conforme aumenta el grado de correlacioacuten entre las variables independie

existe un alto nivel de correlacioacuten entre algunas de las variables independientes nos enfrenun problema que los estadiacutesticos llaman multicolinealidad

La multicolinealidad puede presentarse si deseamos estimar la recuperacioacuten de las ventaempresa y utilizamos tanto el nuacutemero de vendedores empleados como sus salarios totales Cvalores asociados con estas dos variables independientes tienen una correlacioacuten alta neceusar soacutelo un conjunto de ellos para realizar nuestra estimacioacuten De hecho al agregar una segriable que estaacute correlacionada con la primera se distorsionan los valores de los coeficientgresioacuten Sin embargo a menudo podemos predecir bien Y incluso cuando haya multicoline

Consideremos un ejemplo donde existe multicolinealidad para ver coacutemo afecta a la regresrante los 12 meses pasados el gerente del restaurante Pizza Shack ha estado poniendo unaanuncios en el perioacutedico local Los anuncios se programan y pagan el mes anterior a que ap

Un ejemplo demulticolinealidad

Definicioacuten y efecto dela multicolinealidad

9703ᎏ

0082

29109 3ᎏ

0491 6Prueba de lasignificancia de laregresioacuten en elproblema del Serviciode Contribuciones

Anaacutelisis devarianza parala regresioacuten

Prueba F de laregresioacuten como

un todo

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 29 1088 9 7029 118 52 0Er r or 6 0 4912 0 0819Tot al 9 29 6000

FIGURA 13-5Salida de Minitabanaacutelisis devarianza

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2556

Cada anuncio contiene un cupoacuten que permite llevarse dos pizzas pagando solamente la de mcio El gerente recolectoacute los datos de la tabla 13-4 y le gustariacutea utilizarlos para predecir las vpizzas

En las figuras 13-6 y 13-7 se dieron los resultados de Minitab para las regresiones respelas ventas totales sobre el nuacutemero de anuncios y sobre el costo

Para la regresioacuten sobre el nuacutemero de anuncios tenemos que el valor t observado es 395grados de libertad y un nivel de significancia de ϭ 001 se encontroacute que el valor t criacuteticdo de la tabla 2 del apeacutendice) es 3169 Como t o Ͼ t c (o de manera equivalente como p es m001) concluimos que el nuacutemero de anuncios es una variable explicativa altamente signifilas ventas totales Note tambieacuten que r 2 ϭ 610 de modo que el nuacutemero de anuncios explximadamente el 61 de la variacioacuten en las ventas de pizzas

Para la regresioacuten sobre el costo de los anuncios el valor t observado es 454 de modo qude los anuncios es una variable explicativa de las ventas totales todaviacutea maacutes significativa que ro de anuncios (para los que el valor t observado fue soacutelo 395) En esta regresioacuten r 2 ϭ 673

el costo de los anuncios explica aproximadamente el 67 de la variacioacuten de las ventas de pizComo ambas variables explicativas son altamente significativas por siacute mismas intentam

zar ambas en una regresioacuten muacuteltiple El resultado se presenta en la figura 13-8La regresioacuten muacuteltiple es altamente significativa como un todo ya que la p de ANOVA e

Uso de ambas varia-bles explicativas enuna regresioacuten muacuteltiple

Dos regresionessimples

Datos de ventas y anun-cios para el restaurantePizza Shack

Tabla 13-4 X 1 X 2 Y

Nuacutemero Costo de anuncios Venta tode anuncios publicados de pizz

Mes publicados (cientos de doacutelares) (miles de d

Mayo 12 139 436

Junio 11 120 380

Julio 9 93 301

Agosto 7 97 353

Septiembre 12 123 464

Octubre 8 114 342

Noviembre 6 93 302

Diciembre 13 143 407

Enero 8 102 385

Febrero 6 84 226

Marzo 8 112 376

Abril 10 111 352

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esVENTAS = 16 9 + 2 08 ANUNCI OS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 16 937 4 982 3 40 0 007ANUNCI OS 2 0832 0 5271 3 95 0 003

s = 4 206 R- s q = 61 0

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 1 276 31 276 31 15 62 Er r or 10 176 88 17 69Tot a l 11 453 19

Figura 13-6

Regresioacuten de lasventas sobre elnuacutemero deanuncios conMinitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2656

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2756

gar el nuacutemero de anuncios como segunda variable explicativa ademaacutes del costo de los anuncios eplica nada maacutes alrededor del 1 adicional de la variacioacuten de las ventas totales

En este punto es justo preguntarse iquestqueacute variable realmente explica la variacioacuten de las ventotales en la regresioacuten muacuteltiple La respuesta es que ambas la explican pero no podemos separ

sus contribuciones individuales debido a que estaacuten altamente correlacionadas entre siacute E

consecuencia sus coeficientes en la regresioacuten muacuteltiple tienen errores estaacutendar altos valore

calculados relativamente bajos y valores prob Ͼ | t | relativamente altos

iquestDe queacute manera nos afecta esta multicolinealidad Todaviacutea podemos hacer predicciones relativmente precisas cuando se encuentra presente note que para la regresioacuten muacuteltiple (la salida se dala figura 13-8) el error estaacutendar de la estimacioacuten que determina el ancho de los intervalos de co

fianza para las predicciones es 3989 mientras que para la regresioacuten simple con el costo de los anucios como variable explicativa (salida en la figura 13-7) tenemos se ϭ 3849 Lo que no podemhacer es predecir con mucha precisioacuten coacutemo cambiaraacuten las ventas si aumentamos en uno el nuacutemede anuncios La regresioacuten muacuteltiple dice que b1 ϭ 0625 (esto es cada anuncio aumenta las ventotales de pizzas alrededor de $625) pero el error estaacutendar de este coeficiente es 112 (es decir apximadamente $1120)

Las contribucionesindividuales nopueden separarse

Ejercicios 134

Ejercicios de autoevaluacioacuten

EA 13-4 Edith Pratt es una ocupada ejecutiva de una compantildeiacutea de transporte de carga a nivel nacional y va tara una junta porque no encuentra la salida de la regresioacuten muacuteltiple elaborada por un asistente Si la regsioacuten total es significativa al nivel 005 ella desea usar las salida de computadora como evidencia para fudamentar algunas ideas que expondraacute en la reunioacuten Sin embargo su ayudante estaacute enfermo De hectoda la informacioacuten que tiene de la regresioacuten muacuteltiple es un trozo de papel con los siguientes datos

Regresioacuten paraEdith Pratt

SCR 8724 con gl

SCE con 17 gl

SCT 10236 con 24 gl

Como el papel ni siquiera tiene todos los nuacutemeros Edith ha concluido que no es uacutetil Usted sin embardebe saber maacutes que ella iquestPuede Edith entrar en la junta o debe seguir buscando la salida de computador

EA 13-5 Una pequentildea liacutenea aeacuterea de Nueva Inglaterra realizoacute una encuesta sobre sus 15 terminales y obtuvo losguientes datos para el mes de febrero donde

VENTAS ϭ ingreso total seguacuten el nuacutemero de boletos vendidos (en miles de doacutelares)

PROMOCϭ cantidad gastada en promociones de la liacutenea aeacuterea en el aacuterea (en miles de doacutelares)

COMPET ϭ nuacutemero de liacuteneas aeacutereas que compiten en esa terminal

GRATIS ϭ nuacutemero de pasajeros que vuelan gratis (por diferentes razones)

Sugerencia el concepto de hacer infe-rencias respecto a una regresioacuten muacutelti-ple es justo lo mismo que se hizo en elcapiacutetulo 12 cuando hicimos inferencias

respecto a una recta de regresioacuten excepto que ahora se em-

plean dos o maacutes variables independientes Advertencia lamulticolinealidad es un problema que debe manejarse enla regresioacuten muacuteltiple y es necesario desarrollar una com-prensioacuten con sentido comuacuten Recuerde que todaviacutea puedehacer predicciones precisas cuando estaacute presente Pero re-cuerde tambieacuten que no puede decir con mucha precisioacuten

cuaacutento cambiaraacute la variable dependiente si ldquomanipulardquo lavariables independientes Entonces el objetivo debe seminimizar la multicolinealidad Sugerencia la mejor regresioacuten muacuteltiple es la que explica la relacioacuten entre los datos asentildealar la responsabilidad de la mayor proporcioacuten de la va

riacioacuten en la variable dependiente con el menor nuacutemero dvariables independientes Advertencia no es una buenidea incluir demasiadas variables independientes soacutelo porque cuenta con una computadora y un paquete de softwarpara estadiacutestica

SUGERENCIAS

Y

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2856

Ventas (doacutelares) Promoc (doacutelares) Compet Gratis

793 25 10 3

2001 55 8 6

1632 60 12 9

2001 79 7 16

1460 52 8 15

1777 76 12 9

309 20 12 8

2919 90 5 10

1600 40 8 43394 96 5 16

1596 55 11 7

863 30 12 6

2375 60 6 10

1072 50 10 4

1550 35 10 4

a) Utilice la siguiente salida de Minitab para determinar la ecuacioacuten de regresioacuten que mejor se ara la liacutenea aeacuterea

La ec uaci oacuten de r egr es i oacuten esVENTAS ϭ 172 ϩ 25 9 PROMOVϪ 13 2 COMPET Ϫ 3 04 GRATI S

Pr onos t i cador Coef Des vEs t Coci ent e - t Cons t ant e 172 34 51 38 3 35 0PROMOV 25 950 4 877 5 32 0COMPET - 13 238 3 686 - 3 59 0GRATI S - 3 041 2 342 - 1 30 0

b) iquestLos pasajeros que vuelan gratis ocasionan una disminucioacuten significativa en las ventas Fpruebe las hipoacutetesis apropiadas Use ϭ 005

c) iquestUn incremento de $1000 en las promociones cambia las ventas en $28000 o el cambio ecativamente diferente de $28000 Formule y pruebe las hipoacutetesis adecuadas Use ϭ 010

d) Calcule un intervalo de confianza del 90 para el coeficiente de la pendiente de la COMPET

Aplicaciones

13-22 Mark Lowtown publica el perioacutedico Mosquito Junction Enquirer y tiene problemas para predectidad de papel perioacutedico que necesita imprimir diariamente Eligioacute aleatoriamente 27 diacuteas del arior y registroacute la siguiente informacioacuten

PESO ϭ peso en libras de papel perioacutedico para la edicioacuten de ese diacutea

CLASIFICADOS ϭ nuacutemero de anuncios clasificados

PUBLICIDAD ϭ nuacutemero de anuncios publicitarios

PLANA COMPLETA ϭ nuacutemero de anuncios a una plana

Utilizando Minitab para hacer una regresioacuten de PESO sobre las otras tres variables Mark obtuguiente salida

Pr onos t i cador Coef Des vEs t Coci ent e- t Cons t ant e 1072 95 872 43 1 23 0CLASI FI CADOS 0 251 0 126 1 99 0PUBLI CI DAD 1 250 0 884 1 41 0PLANA COMPLETA 250 66 67 92 3 69 0

a) Mark siempre ha pensado que cada anuncio publicitario utiliza al menos 3 libras de papel iquestsioacuten le da una razoacuten significativa para dudar esto al nivel del 5

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2956

b) De manera similar Mark siempre ha creiacutedo que cada anuncio clasificado utiliza aproximmedia libra de papel iquestTiene ahora Mark una razoacuten significativa para dudar esto al nivel del

c) Mark vende espacios de anuncios de plana completa a los comerciantes locales a $30 la paacutegberaacute pensar en ajustar sus tarifas si el papel perioacutedico le cuesta $009 por libra Suponga costos son despreciables Establezca expliacutecitamente las hipoacutetesis y una conclusioacuten (Sugere

jando todo lo demaacutes constante cada anuncio adicional de plana completa tiene un costo de bras de papel ϫ $009 por libra ϭ $2256 El punto de equilibrio es 333333 libras iquestPor quel coeficiente de pendiente para PLANA COMPLETA es significativamente mayor que Mark no estaacute obteniendo ganancias y debe cambiar sus tarifas)

13-23 Para los datos del ejercicio 13-18 y un nivel de significancia de 010 iquestcuaacuteles variables son sign

mente explicativas de los resultados de los exaacutemenes (Habiacutea 12 estudiantes en la muestra) 13-24 Para los datos del ejercicio 13-18 y la siguiente salida de Minitab del procedimiento de regresiple hecho por Bill

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 3134 42 783 60Er r or 7 951 25 135 89Tot a l 11 4085 67

a) iquestCuaacutel es el valor observado de F b) A un nivel de significancia de 005 iquestcuaacutel es el valor criacutetico de F que se debe utilizar para d

si la regresioacuten como un todo es significativac) Basaacutendose en las respuestas a los incisos a) y b) iquestes la regresioacuten significativa como un tod

13-25 Remiacutetase al ejercicio 13-19 A un nivel de significancia de 001 iquestes la variable DISTANCIA uble explicativa significativa para VENTAS

13-26 Para los datos del ejercicio 13-19 y la siguiente salida adicional de Minitab al correr la regresioacuten

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 2861495 715374 102 39 0Er r or 18 125761 6896 7Tot a l 22 2987256

Al nivel de significancia de 005 iquestes la regresioacuten significativa como un todo

13-27 Henry Lander es el director de produccioacuten de la Alecos Corporation de Caracas Venezuela Hede que le ayude a determinar una foacutermula para predecir el ausentismo de los empacadores de chipoacutetesis es que la temperatura diaria promedio puede explicar el porcentaje de ausentismo Durios meses reuacutene datos ejecuta el procedimiento de regresioacuten simple y encuentra que la tempeplica 66 de la variacioacuten en el ausentismo Pero Henry no estaacute convencido de que eacuteste sea un cador satisfactorio Sugiere que la precipitacioacuten pluvial diaria podriacutea tambieacuten tener algo que vausentismo de modo que registra los datos correspondientes y hace una regresioacuten del ausentismte el tiempo de lluvias y obtiene un valor R2 de 059 ldquoiexclEurekardquo grita usted ldquoiexclLo tengo Con uticador que explica 66 y otro que explica 59 todo lo que tengo que hacer es una regresioacutenutilizando ambos y seguramente tendreacute un pronosticador casi perfectordquo Para su desaacutenimo sin la regresioacuten muacuteltiple tiene una R

2 de soacutelo 68 que es solamente un poco mejor que la variablperatura sola iquestCoacutemo puede explicar esta aparente discrepancia

13-28 Juan Armenlegg administrador de Rockyrsquos Diamond y Jewelry Store estaacute interesado en desamodelo para estimar la demanda del consumidor para su costosa mercanciacutea Como la mayoriacutea de

tes compran diamantes y joyas a creacutedito Juan estaacute seguro de que dos factores que deben influirmanda de los clientes son la tasa real de inflacioacuten anual y la tasa real de intereses sobre preacutestamprincipales bancos del paiacutes Explique algunos problemas que Juan podriacutea encontrar si fuera a dun modelo de regresioacuten basado en estas dos variables de prediccioacuten

13-29 Un nuevo programa de juegos Check That Model pide a los concursantes que especifiquen el nuacutenimo de paraacutemetros que necesitan para determinar si un modelo de regresioacuten muacuteltiple es signifimo un todo para ϭ 001 Usted ganoacute la apuesta con 4 paraacutemetros Use la siguiente informacioacutenterminar si la regresioacuten es significativa

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3056

R 2

ϭ 07452

SCE ϭ 1254

n ϭ 18

Nuacutemero de variables independientes ϭ 3

13-30 La Scottish Turist Agency estaacute interesada en el nuacutemero de turistas que entran al paiacutes cada semanrante la temporada alta Se recolectaron los siguientes datos

Turistas (Y ) ϭ nuacutemero de turistas que entran a Escocia en una semana (en miles)

Cambio (X 1)ϭ nuacutemero de libras escocesas compradas por $1 doacutelar

Precio (X 2) ϭ nuacutemero de libras escocesas cobradas por viaje redondo en camioacuten de Londres a Edimburgo

Promoc (X 3) ϭ cantidad gastada en promocioacuten del paiacutes (en miles de libras escocesas)Temp (X 4) ϭ temperatura media durante la semana en Edimburgo (en grados Celsius)

Turistas (Y ) Cambio (X 1) Precio (X 2) Promoc (X 3) Temp (X 4)

69 061 40 87 154

71 059 40 88 156

68 063 40 85 154

79 061 35 86 153

76 060 35 94 158

82 065 35 99 162

80 058 35 98 164

84 059 35 102 166

97 061 30 114 174

98 062 30 116 172

72 057 40 84 176

67 055 40 86 164

a) Utilice el paquete de software que tenga para determinar la ecuacioacuten de regresioacuten que mejote a los datos de la agencia de turismo

b) iquestEs la tasa de cambio una variable explicativa significativa Establezca y pruebe las hipoacutetesidas a un nivel de significancia de 010

c) Un incremento de 1000 libras en las promociones iquestaumenta el nuacutemero de turistas en maacutesEstablezca y pruebe las hipoacutetesis adecuadas para un nivel de significancia de 005

d) Calcule un intervalo de confianza del 95 para el coeficiente de la pendiente de Temp

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-4 Como SCT ϭ SCR ϩ SCE SCE ϭ SCT Ϫ SCR ϭ 10236 Ϫ 8724 ϭ 1512Como gl SCT ϭ gl SCR ϩ gl SCE gl SCR ϭ gl SCT Ϫ gl SCE ϭ 24 Ϫ 17 ϭ 7

Entonces F ϭ ϭ ϭ 1401

F CRiacuteT ϭ F (7 17 005) ϭ 261Como F OBS gt F CRIacuteT se concluye que la regresioacuten es significativa como un todo Edith debe conticando la salida de computadora de la regresioacuten para usarla en la junta

EA 13-5 De la salida de computadora se obti enen los siguientes resultadosa) VENTAS ϭ 17234 ϩ 25950PROMOC Ϫ13238COMPET Ϫ 3041GRATISb) H0 BGRATIS ϭ 0 H1 BGRATIS Ͻ 0 ϭ 005

Eacutesta es una prueba de una cola y el valor prob en los resultados es para la alternativa de dos c BGRATIS 0 De manera que para esta prueba el valor prob es 02212 ϭ 0111 Ͼ ϭ 00que no se puede rechazar H0 las ventas no disminuyen significativamente cuando aumenta ro de pasajeros que vuelan gratis

c) H0 BPROMOC ϭ 28 H1 BPROMOC 28 ϭ 010

87247ᎏᎏ

151217SCRk ᎏᎏ

SCE(n Ϫ k Ϫ 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3156

El valor observado t de los resultados de regresioacuten es

ϭ ϭ Ϫ0420

Con 11 grados de libertad y ϭ 010 en ambas colas combinadas los valores criacuteticos t parba son Ϯ1796 asiacute el valor observado estaacute dentro de la regioacuten de aceptacioacuten No se rechacambio en VENTAS para un incremento de una unidad ($1000) en PROMOC no es significate diferente de 28 ($28000)

d) Con 11 grados de libertad el valor t para un intervalo del 90 de confianza es 1796 por lo

tervalo esbCOMP Ϯ 1796sbCOMP

ϭ Ϫ13238 Ϯ 1796(3686)

ϭ Ϫ13238 Ϯ 6620 ϭ (Ϫ19858 Ϫ 6618)

La liacutenea aeacuterea puede tener una seguridad del 90 de que el ingreso por los boletos en una ofminuye entre $6600 y $19900 aproximadamente con cada liacutenea aeacuterea adicional que comp

135 Teacutecnicas de modelado

Dada una variable que deseamos explicar y un conjunto de variables explicativas potencialehaya varias ecuaciones de regresioacuten diferentes que podamos estudiar dependiendo de queacute explicativas incluyamos y de coacutemo lo hagamos Cada una de esas ecuaciones de regresioacutence como modelo Las teacutecnicas de modelado son las distintas formas en que podemos incluriables explicativas y verificar queacute tan apropiados son los modelos de regresioacuten Existen municas de modelado diferentes pero soacutelo veremos dos de las maacutes utilizadas

Datos cualitativos y variables ficticias

En todos los ejemplos de regresioacuten que hemos visto hasta ahora los datos manejados hanmeacutericos o cuantitativos Pero ocasionalmente nos enfrentaremos con una variable categoacuterilitativa En el problema del inicio el capiacutetulo el director de personal desea ver si el salarioun vendedor depende de su sexo En la tabla 13-5 repetimos los datos de dicho problema

Por el momento ignore la antiguumledad y utilice la teacutecnica desarrollada en el capiacutetulo 9 bar la diferencia entre las medias de dos poblaciones para ver si los hombres ganan maacutes qu

jeres Pruebe con ϭ 001 Si tomamos a los hombres como la poblacioacuten 1 y a las mujerespoblacioacuten 2 probaremos las siguientes hipoacutetesis

H0 1 ϭ 2 larr Hipoacutetesis nula no existe discriminacioacuten por sexo en los salarios base

H1 1 Ͼ 2 larr Hipoacutetesis alternativa se discrimina a las mujeres en su salario base

ϭ 001 larr Nivel de significancia

Revisioacuten del enfoqueanterior del problema

Buacutesqueda dediferentes modelos

25950 Ϫ 28ᎏᎏ

4877

(bPROMOC Ϫ 28)ᎏᎏ

sbPROMOC

Datos para el problemade discriminacioacuten porsexo

Tabla 13-5 Vendedores VendedorasAntiguumledad Salario base Antiguumledad Salario base(en meses) (en miles) (en meses) (en miles)

6 75 5 62

10 86 13 87

12 91 15 94

18 103 21 98

30 130

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3256

A continuacioacuten bosquejamos el anaacutelisis Si tiene problemas para seguirlo deberaacute repasamente la seccioacuten 93

n1 ϭ 5 n2 ϭ 4

x ෆ1 ϭ 97 x ෆ2 ϭ 8525

s2

1 ϭ 4415 s2

2 ϭ 2609

s2

p ϭ

ϭ

ϭ 3641

x ෆ1Ϫ x

ෆ2ϭ s pΊ ϩ

ϭ 128

t ϭ

ϭ

ϭ 092

Con siete grados de libertad el valor t criacutetico para una prueba de cola superior con ϭ 001 eComo el valor t observado de 092 es menor que 2998 no podemos rechazar H0

Entonces el anaacutelisis concluye que no parece haber discriminacioacuten por sexo en los salarPero recuerde que hasta ahora se han ignorado los datos de antiguumledad laboral para el anaacuteli

Antes de seguir vea el diagrama de dispersioacuten de los datos En la figura 13-9 los punto

corresponden a los hombres y los blancos a las mujeres El diagrama de dispersioacuten muestraridad que el salario base aumenta con los antildeos de antiguumledad pero si con la mirada sigue lo qla recta de regresioacuten notaraacute que los puntos negros tienden a estar arriba de ella y los blancos

La figura 13-10 da la salida de una regresioacuten del salario base sobre los meses de antiguumlelos resultados se ve que la antiguumledad es una variable explicativa altamente significativa

Ademaacutes r 2

ϭ 926 que indica que la variable meses de antiguumledad explica cerca del 9variacioacuten en el salario base La figura 13-11 contiene parte de la salida que no se vio antesbla de residuos Para cada punto el residuo es simplemente Y Ϫ Y ˆ que se reconoce como el

Una ldquomiradardquo a los

datos

El enfoque anterior nodetecta discriminacioacuten

(97 ndash 8525) ndash 0ᎏᎏ

128

( x ෆ1 ndash x ෆ2) ndash (1 Ϫ 2)H0

ᎏᎏᎏ

ˆ x ෆ1Ϫ

x ෆ2

1ᎏ

n2

1ᎏ

n1

4(4415) ϩ 3(2609)ᎏᎏᎏ5 ϩ 4 ndash 2

(n1 ndash 1)s21 ϩ (n2 ndash 1)s22ᎏᎏᎏ

n1 ϩ n2 ndash 2

FIGURA 13-9

Diagrama de dis-persioacuten de salariosbase contra mesesde antiguumledad

4 8 12 16 20 24 28

4

8

12

Meses de antiguumledad

S a l a r i o ( m i l e s d e d oacute l a r e s )

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3356

el ajuste de la recta de regresioacuten en ese punto En la figura 13-11 AJUST1 son los valores y RESI1 son los residuos

Tal vez la parte maacutes importante del anaacutelisis del resultado de una regresioacuten sea estusiduos Si la regresioacuten incluye todos los factores explicativos relevantes estos residuo

ser aleatorios Dicho de otro modo si los residuos muestran cualquier patroacuten no aleat

to indica que hay algo sistemaacutetico que afecta el proceso y que no hemos tomado en cu

manera que buscamos patrones en los residuos o para decirlo de forma maacutes pintoresca ldquopmos a los residuos hasta hacerlos hablarrdquo

Si observamos los residuos presentados en la figura 13-11 vemos que los primeros cincoson positivos De modo que para los vendedores tenemos Y ndash Y ˆ Ͼ 0 o Y Ͼ Y ˆ es decir laregresioacuten cae abajo de estos cinco puntos Tres de los cuatro uacuteltimos residuos son negaticonsiguiente para las vendedoras tenemos Y Ϫ Y ˆ Ͻ 0 o Y Ͻ Y ˆ asiacute que la recta de regresicuentra arriba de tres de los cuatro puntos Esto confirma lo que vimos al observar el diagdispersioacuten de la figura 13-9 Este patroacuten no aleatorio en los residuos sugiere que el sexo siacute etor determinante del salario base

iquestCoacutemo podemos incorporar el sexo de los vendedores dentro del modelo de regresioacutencemos utilizando un dispositivo llamado variable ficticia (o variable indicadora) Para lpuntos que representan a los vendedores esta variable tiene valor de 0 y para los cuatro purepresentan a las vendedoras valdraacute 1 Los datos de entrada para nuestra regresioacuten con variticias se dan en la tabla 13-6

Para los datos de la tabla 13-6 se ajusta una regresioacuten de la forma

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

Uso de variablesficticias

Deteccioacuten depatrones en losresiduos

ldquoPresionar a losresiduosrdquo

Anaacutel i s i s de r e gr e s i oacuten

La ec uac i oacuten de r e gr es i oacuten esSALARI O ϭ 5 81 ϩ 0 233 MESES

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t pCons t a nt e 5 8093 0 4038 14 39 0 000MESES 0 23320 0 02492 9 36 0 000

s ϭ 0 5494 R- s q ϭ 92 6

Anaacute l i s i s de va r i a nz aFUENTE GL SC MC F Re gr e s i oacuten 1 26 443 24 443 87 61 0Er r or 7 2 113 0 302Tot a l 8 28 556

FIGURA 13-10

Regresioacuten conMinitab del salariobase sobre losmeses deantiguumledad

RENGLOacuteN SALARI O AJ UST1 RESI 1

1 7 5 7 2085 0 2914992 8 6 8 1413 0 458684

3 9 1 8 6077 0 4922764 10 3 10 0069 0 2930545 13 0 12 8054 0 1946076 6 2 6 9753 - 0 7752977 8 7 8 8409 - 0 1409288 9 4 9 3073 0 0926649 9 8 10 7066 - 0 906558

FIGURA 13-11

Tabla de residuosde Minitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2256

explicativa significativa De hecho al observar los valores t calculados para las otras dos vindependientes (tiempo de auditoriacuteas de campo t o ϭ 736 y recompensa a informantes t ovemos que tambieacuten son variables explicativas significativas

Podemos tambieacuten utilizar la columna de ldquoprdquo para probar si X i es una variable explicativacativa De hecho utilizando esa informacioacuten ni siquiera necesitamos usar la tabla 2 del aLos elementos de esta columna son los valores prob para las hipoacutetesis

H0 Biϭ 0

H1 Bi 0

Recuerde del anaacutelisis hecho en el capiacutetulo 9 que estos valores prob constituyen la probabque cada bi esteacute tan lejos de cero como (o maacutes) el valor observado obtenido de la regresioacutenverdadera Como se ilustra en la figura 13-3 solamente necesitamos comparar estos valocon el nivel de significancia de la prueba para determinar si X i es o no una variable expsignificativa para Y

Probar la significancia de una variable explicativa es siempre una prueba de dos colas Lble independiente X i es una variable explicativa significativa si bi es significativamente dife

cero es decir si t o es un nuacutemero grande positivo o negativoPara el ejemplo del IRS repetimos las pruebas con ϭ 001 Para cada una de las tres v

independientes p es menor que 001 de forma que podemos concluir que cada una de ellanificativa

Inferencias acerca de la regresioacuten como un todo

(usando una prueba F )

Suponga que cubre con papel un tablero para dardos y lanza varios dardos sobre eacutel Despueacuteberlo hecho tendraacute algo muy parecido a un diagrama de dispersioacuten Suponga entonces quuna recta de regresioacuten a este conjunto de ldquopuntos observadosrdquo y calcula r

2 Debido a que lofueron lanzados aleatoriamente usted espera obtener un valor bajo de r

2 puesto que en esten realidad no explica a Y Sin embargo si hace esto muchas veces ocasionalmente observalor alto de r

2 por pura casualidadDada cualquier regresioacuten simple (o muacuteltiple) es natural preguntarse si el valor de r2 (

realmente indica que las variables independientes explican a Y o si esto sucede por cas

A menudo esta interrogante se plantea de la siguiente manera iquestla regresioacuten como un todo ficativa En la uacuteltima seccioacuten vimos coacutemo decidir si una X i individual es una variable exp

Significancia de laregresioacuten comoun todo

FIGURA 13-3

Uso de ldquoprdquo paradeterminar si X i esuna variable expli-cativa significativa

Regioacuten de aceptacioacuten Regioacuten de aceptacioacuten

2 del aacuterea

2 del aacuterea

2 del aacuterea

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

Acepte la hipoacutetesis nula si elvalor muestral estaacute en esta regioacuten

ndasht c

ndasht o

t o

t c

0

(a) p es mayor que X

i no es una variable

explicativa significativa

(b) p es menor que X

i es una variable

explicativa significativa

ndasht o

ndasht c

t c

0

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2356

significativa ahora veremos coacutemo decidir si todas las X i tomadas en conjunto explican significavamente la variabilidad observada de Y Nuestras hipoacutetesis son

H0 B1 ϭ B2 ϭ ϭ Bk ϭ 0 larr Hipoacutetesis nula Y no depende de las X i

H1 por lo menos una Bi 0 larr Hipoacutetesis alternativa Y depende de al menos una de las X i

Cuando analizamos r 2 en el capiacutetulo 12 consideramos la variacioacuten total en Y sum(Y Ϫ Y ෆ )2 la p

te de dicha variacioacuten que explica la regresioacuten sum(Y ˆ Ϫ Y ෆ )2 y la parte no explicada de la variacioacutensum(Y Ϫ Y ˆ )2 La figura 13-4 es un duplicado de la figura 12-15 Sirve como repaso de la relacioacuten etre la desviacioacuten total la desviacioacuten explicada y la desviacioacuten no explicada para un solo dato en uregresioacuten simple Aunque no podamos dibujar una figura similar para una regresioacuten muacuteltiple coceptualmente estamos haciendo lo mismo

Al analizar la variacioacuten en Y fijamos nuestra atencioacuten en tres teacuterminos diferentes cada uno de cuales es una suma de cuadrados Los denotamos con

Suma de cuadradosy sus grados delibertad

Anaacutelisis de lavariacioacuten de losvalores Y

FIGURA 13-4

Desviacioacuten totaldesviacioacutenexplicada ydesviacioacuten noexplicada paraun valor observadode Y

Y

X

Un valor observado de lavariable dependiente (Y )

R e c t a d

e r e g r e s

i oacute n

Desviacioacuten no explicada de esta Y respectoa su media Y

(Y ndash Y )^

Desviacioacuten explicada deesta Y respecto a su media Y

(Y ndash Y )^Y

Valor estimado de esta Y

a partir de la recta de regresioacuten (Y )^

Desviacioacuten total de esta Y

respecto a su media Y

(Y ndash Y )

Tres sumas de cuadrados

SCT ϭ suma de cuadrados total (es decir la parte explicada) ϭ sum(Y Ϫ Y ෆ )2

SCR ϭ suma de cuadrados de la regresioacuten (es decir la parte explicada) ϭ sum(Y ˆ Ϫ Y ෆ )2 [13-10

SCE ϭ suma de cuadrados del error (es decir la parte no explicada) ϭ sum(Y Ϫ Y ˆ )2

Estaacuten relacionadas por la ecuacioacuten

que dice que la variacioacuten total en Y puede dividirse en dos partes la parte explicada y la no explicaCada una de estas sumas de cuadrados tiene un nuacutemero asociado de grados de libertad SCT t

ne n Ϫ 1 grados de libertad (n observaciones menos un grado de libertad debido a que la media la muestra estaacute fija) SCR tiene k grados de libertad porque existen k variables independientes qse utilizaron para explicar Y Finalmente SCE tiene n Ϫ k Ϫ 1 grados de libertad porque utilizamnuestras n observaciones para estimar k ϩ 1 constantes a b1 b2 bk Si la hipoacutetesis nula es ci

ta el cociente

Descomposicioacuten de la variacioacuten total de Y

SCT ϭ SCR ϩ SCE [13-1

Cociente F

F ϭ [13-12SCR k ᎏᎏ

SCE(n ndash k ndash 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2456

tiene una distribucioacuten F con k grados de libertad en el numerador y n Ϫ k Ϫ 1 grados de libel denominador Si la hipoacutetesis nula es falsa entonces el cociente tiende a ser maacutes grande qula hipoacutetesis nula es verdadera De modo que si el cociente F es demasiado grande (seguacuten lo na el nivel de significancia de la prueba y el valor apropiado de la tabla 6 del apeacutendice) rechH0 y concluimos que la regresioacuten como un todo es significativa

La figura 13-5 presenta la salida de Minitab para el problema del IRS Esta parte del rincluye los cocientes F calculados para la regresioacuten en ocasiones llamado anaacutelisis de v

(ANOVA) para la regresioacuten Probablemente se pregunte si esto tiene algo que ver con el anaacutelisrianza que estudiamos en el capiacutetulo 11 La respuesta es siacute Aunque no lo hicimos es posibletrar que el anaacutelisis de varianza visto en el capiacutetulo 11 tambieacuten contempla la variacioacuten total las observaciones alrededor de la gran media y la divide en dos partes una explicada por lascias entre los distintos grupos (que corresponde a lo que llamamos varianza entre columnas)

no explicada por dichas diferencias (que corresponde a la varianza dentro de columnas) Estcisamente anaacutelogo a lo que acabamos de hacer en la ecuacioacuten 13-11Para el problema del IRS vemos que SCR ϭ 29109 (con k ϭ 3 grados de libertad) SCE

(con n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad) y que

F ϭ ϭ ϭ 11833

Los elementos en la columna ldquoMCrdquo son justo las sumas de cuadrados divididas entre sus glibertad Para 3 grados de libertad en el numerador y 6 en el denominador la tabla 6 del apeacutence que 978 es el liacutemite superior de la regioacuten de aceptacioacuten para un nivel de significancia El valor calculado de F 11833 estaacute muy por arriba de 978 de manera que se ve que la r

como un todo es altamente significativa Se puede llegar a la misma conclusioacuten si se observresultado del programa dice que ldquo prdquo es 0000 Debido a que este valor prob es menor que elsignificancia ϭ 001 se concluye que la regresioacuten completa es significativa De esta mapuede usar la p de ANOVA como prueba sin tener que utilizar la tabla 6 del apeacutendice para bvalor criacutetico de F Esto es anaacutelogo a la manera en que se usaron los valores de p en la figura ra probar la significancia de las variables explicativas individuales

Multicolinealidad en la regresioacuten muacuteltiple

En el anaacutelisis de regresioacuten muacuteltiple los coeficientes de regresioacuten a menudo se vuelven

confiables conforme aumenta el grado de correlacioacuten entre las variables independie

existe un alto nivel de correlacioacuten entre algunas de las variables independientes nos enfrenun problema que los estadiacutesticos llaman multicolinealidad

La multicolinealidad puede presentarse si deseamos estimar la recuperacioacuten de las ventaempresa y utilizamos tanto el nuacutemero de vendedores empleados como sus salarios totales Cvalores asociados con estas dos variables independientes tienen una correlacioacuten alta neceusar soacutelo un conjunto de ellos para realizar nuestra estimacioacuten De hecho al agregar una segriable que estaacute correlacionada con la primera se distorsionan los valores de los coeficientgresioacuten Sin embargo a menudo podemos predecir bien Y incluso cuando haya multicoline

Consideremos un ejemplo donde existe multicolinealidad para ver coacutemo afecta a la regresrante los 12 meses pasados el gerente del restaurante Pizza Shack ha estado poniendo unaanuncios en el perioacutedico local Los anuncios se programan y pagan el mes anterior a que ap

Un ejemplo demulticolinealidad

Definicioacuten y efecto dela multicolinealidad

9703ᎏ

0082

29109 3ᎏ

0491 6Prueba de lasignificancia de laregresioacuten en elproblema del Serviciode Contribuciones

Anaacutelisis devarianza parala regresioacuten

Prueba F de laregresioacuten como

un todo

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 29 1088 9 7029 118 52 0Er r or 6 0 4912 0 0819Tot al 9 29 6000

FIGURA 13-5Salida de Minitabanaacutelisis devarianza

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2556

Cada anuncio contiene un cupoacuten que permite llevarse dos pizzas pagando solamente la de mcio El gerente recolectoacute los datos de la tabla 13-4 y le gustariacutea utilizarlos para predecir las vpizzas

En las figuras 13-6 y 13-7 se dieron los resultados de Minitab para las regresiones respelas ventas totales sobre el nuacutemero de anuncios y sobre el costo

Para la regresioacuten sobre el nuacutemero de anuncios tenemos que el valor t observado es 395grados de libertad y un nivel de significancia de ϭ 001 se encontroacute que el valor t criacuteticdo de la tabla 2 del apeacutendice) es 3169 Como t o Ͼ t c (o de manera equivalente como p es m001) concluimos que el nuacutemero de anuncios es una variable explicativa altamente signifilas ventas totales Note tambieacuten que r 2 ϭ 610 de modo que el nuacutemero de anuncios explximadamente el 61 de la variacioacuten en las ventas de pizzas

Para la regresioacuten sobre el costo de los anuncios el valor t observado es 454 de modo qude los anuncios es una variable explicativa de las ventas totales todaviacutea maacutes significativa que ro de anuncios (para los que el valor t observado fue soacutelo 395) En esta regresioacuten r 2 ϭ 673

el costo de los anuncios explica aproximadamente el 67 de la variacioacuten de las ventas de pizComo ambas variables explicativas son altamente significativas por siacute mismas intentam

zar ambas en una regresioacuten muacuteltiple El resultado se presenta en la figura 13-8La regresioacuten muacuteltiple es altamente significativa como un todo ya que la p de ANOVA e

Uso de ambas varia-bles explicativas enuna regresioacuten muacuteltiple

Dos regresionessimples

Datos de ventas y anun-cios para el restaurantePizza Shack

Tabla 13-4 X 1 X 2 Y

Nuacutemero Costo de anuncios Venta tode anuncios publicados de pizz

Mes publicados (cientos de doacutelares) (miles de d

Mayo 12 139 436

Junio 11 120 380

Julio 9 93 301

Agosto 7 97 353

Septiembre 12 123 464

Octubre 8 114 342

Noviembre 6 93 302

Diciembre 13 143 407

Enero 8 102 385

Febrero 6 84 226

Marzo 8 112 376

Abril 10 111 352

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esVENTAS = 16 9 + 2 08 ANUNCI OS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 16 937 4 982 3 40 0 007ANUNCI OS 2 0832 0 5271 3 95 0 003

s = 4 206 R- s q = 61 0

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 1 276 31 276 31 15 62 Er r or 10 176 88 17 69Tot a l 11 453 19

Figura 13-6

Regresioacuten de lasventas sobre elnuacutemero deanuncios conMinitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2656

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2756

gar el nuacutemero de anuncios como segunda variable explicativa ademaacutes del costo de los anuncios eplica nada maacutes alrededor del 1 adicional de la variacioacuten de las ventas totales

En este punto es justo preguntarse iquestqueacute variable realmente explica la variacioacuten de las ventotales en la regresioacuten muacuteltiple La respuesta es que ambas la explican pero no podemos separ

sus contribuciones individuales debido a que estaacuten altamente correlacionadas entre siacute E

consecuencia sus coeficientes en la regresioacuten muacuteltiple tienen errores estaacutendar altos valore

calculados relativamente bajos y valores prob Ͼ | t | relativamente altos

iquestDe queacute manera nos afecta esta multicolinealidad Todaviacutea podemos hacer predicciones relativmente precisas cuando se encuentra presente note que para la regresioacuten muacuteltiple (la salida se dala figura 13-8) el error estaacutendar de la estimacioacuten que determina el ancho de los intervalos de co

fianza para las predicciones es 3989 mientras que para la regresioacuten simple con el costo de los anucios como variable explicativa (salida en la figura 13-7) tenemos se ϭ 3849 Lo que no podemhacer es predecir con mucha precisioacuten coacutemo cambiaraacuten las ventas si aumentamos en uno el nuacutemede anuncios La regresioacuten muacuteltiple dice que b1 ϭ 0625 (esto es cada anuncio aumenta las ventotales de pizzas alrededor de $625) pero el error estaacutendar de este coeficiente es 112 (es decir apximadamente $1120)

Las contribucionesindividuales nopueden separarse

Ejercicios 134

Ejercicios de autoevaluacioacuten

EA 13-4 Edith Pratt es una ocupada ejecutiva de una compantildeiacutea de transporte de carga a nivel nacional y va tara una junta porque no encuentra la salida de la regresioacuten muacuteltiple elaborada por un asistente Si la regsioacuten total es significativa al nivel 005 ella desea usar las salida de computadora como evidencia para fudamentar algunas ideas que expondraacute en la reunioacuten Sin embargo su ayudante estaacute enfermo De hectoda la informacioacuten que tiene de la regresioacuten muacuteltiple es un trozo de papel con los siguientes datos

Regresioacuten paraEdith Pratt

SCR 8724 con gl

SCE con 17 gl

SCT 10236 con 24 gl

Como el papel ni siquiera tiene todos los nuacutemeros Edith ha concluido que no es uacutetil Usted sin embardebe saber maacutes que ella iquestPuede Edith entrar en la junta o debe seguir buscando la salida de computador

EA 13-5 Una pequentildea liacutenea aeacuterea de Nueva Inglaterra realizoacute una encuesta sobre sus 15 terminales y obtuvo losguientes datos para el mes de febrero donde

VENTAS ϭ ingreso total seguacuten el nuacutemero de boletos vendidos (en miles de doacutelares)

PROMOCϭ cantidad gastada en promociones de la liacutenea aeacuterea en el aacuterea (en miles de doacutelares)

COMPET ϭ nuacutemero de liacuteneas aeacutereas que compiten en esa terminal

GRATIS ϭ nuacutemero de pasajeros que vuelan gratis (por diferentes razones)

Sugerencia el concepto de hacer infe-rencias respecto a una regresioacuten muacutelti-ple es justo lo mismo que se hizo en elcapiacutetulo 12 cuando hicimos inferencias

respecto a una recta de regresioacuten excepto que ahora se em-

plean dos o maacutes variables independientes Advertencia lamulticolinealidad es un problema que debe manejarse enla regresioacuten muacuteltiple y es necesario desarrollar una com-prensioacuten con sentido comuacuten Recuerde que todaviacutea puedehacer predicciones precisas cuando estaacute presente Pero re-cuerde tambieacuten que no puede decir con mucha precisioacuten

cuaacutento cambiaraacute la variable dependiente si ldquomanipulardquo lavariables independientes Entonces el objetivo debe seminimizar la multicolinealidad Sugerencia la mejor regresioacuten muacuteltiple es la que explica la relacioacuten entre los datos asentildealar la responsabilidad de la mayor proporcioacuten de la va

riacioacuten en la variable dependiente con el menor nuacutemero dvariables independientes Advertencia no es una buenidea incluir demasiadas variables independientes soacutelo porque cuenta con una computadora y un paquete de softwarpara estadiacutestica

SUGERENCIAS

Y

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2856

Ventas (doacutelares) Promoc (doacutelares) Compet Gratis

793 25 10 3

2001 55 8 6

1632 60 12 9

2001 79 7 16

1460 52 8 15

1777 76 12 9

309 20 12 8

2919 90 5 10

1600 40 8 43394 96 5 16

1596 55 11 7

863 30 12 6

2375 60 6 10

1072 50 10 4

1550 35 10 4

a) Utilice la siguiente salida de Minitab para determinar la ecuacioacuten de regresioacuten que mejor se ara la liacutenea aeacuterea

La ec uaci oacuten de r egr es i oacuten esVENTAS ϭ 172 ϩ 25 9 PROMOVϪ 13 2 COMPET Ϫ 3 04 GRATI S

Pr onos t i cador Coef Des vEs t Coci ent e - t Cons t ant e 172 34 51 38 3 35 0PROMOV 25 950 4 877 5 32 0COMPET - 13 238 3 686 - 3 59 0GRATI S - 3 041 2 342 - 1 30 0

b) iquestLos pasajeros que vuelan gratis ocasionan una disminucioacuten significativa en las ventas Fpruebe las hipoacutetesis apropiadas Use ϭ 005

c) iquestUn incremento de $1000 en las promociones cambia las ventas en $28000 o el cambio ecativamente diferente de $28000 Formule y pruebe las hipoacutetesis adecuadas Use ϭ 010

d) Calcule un intervalo de confianza del 90 para el coeficiente de la pendiente de la COMPET

Aplicaciones

13-22 Mark Lowtown publica el perioacutedico Mosquito Junction Enquirer y tiene problemas para predectidad de papel perioacutedico que necesita imprimir diariamente Eligioacute aleatoriamente 27 diacuteas del arior y registroacute la siguiente informacioacuten

PESO ϭ peso en libras de papel perioacutedico para la edicioacuten de ese diacutea

CLASIFICADOS ϭ nuacutemero de anuncios clasificados

PUBLICIDAD ϭ nuacutemero de anuncios publicitarios

PLANA COMPLETA ϭ nuacutemero de anuncios a una plana

Utilizando Minitab para hacer una regresioacuten de PESO sobre las otras tres variables Mark obtuguiente salida

Pr onos t i cador Coef Des vEs t Coci ent e- t Cons t ant e 1072 95 872 43 1 23 0CLASI FI CADOS 0 251 0 126 1 99 0PUBLI CI DAD 1 250 0 884 1 41 0PLANA COMPLETA 250 66 67 92 3 69 0

a) Mark siempre ha pensado que cada anuncio publicitario utiliza al menos 3 libras de papel iquestsioacuten le da una razoacuten significativa para dudar esto al nivel del 5

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2956

b) De manera similar Mark siempre ha creiacutedo que cada anuncio clasificado utiliza aproximmedia libra de papel iquestTiene ahora Mark una razoacuten significativa para dudar esto al nivel del

c) Mark vende espacios de anuncios de plana completa a los comerciantes locales a $30 la paacutegberaacute pensar en ajustar sus tarifas si el papel perioacutedico le cuesta $009 por libra Suponga costos son despreciables Establezca expliacutecitamente las hipoacutetesis y una conclusioacuten (Sugere

jando todo lo demaacutes constante cada anuncio adicional de plana completa tiene un costo de bras de papel ϫ $009 por libra ϭ $2256 El punto de equilibrio es 333333 libras iquestPor quel coeficiente de pendiente para PLANA COMPLETA es significativamente mayor que Mark no estaacute obteniendo ganancias y debe cambiar sus tarifas)

13-23 Para los datos del ejercicio 13-18 y un nivel de significancia de 010 iquestcuaacuteles variables son sign

mente explicativas de los resultados de los exaacutemenes (Habiacutea 12 estudiantes en la muestra) 13-24 Para los datos del ejercicio 13-18 y la siguiente salida de Minitab del procedimiento de regresiple hecho por Bill

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 3134 42 783 60Er r or 7 951 25 135 89Tot a l 11 4085 67

a) iquestCuaacutel es el valor observado de F b) A un nivel de significancia de 005 iquestcuaacutel es el valor criacutetico de F que se debe utilizar para d

si la regresioacuten como un todo es significativac) Basaacutendose en las respuestas a los incisos a) y b) iquestes la regresioacuten significativa como un tod

13-25 Remiacutetase al ejercicio 13-19 A un nivel de significancia de 001 iquestes la variable DISTANCIA uble explicativa significativa para VENTAS

13-26 Para los datos del ejercicio 13-19 y la siguiente salida adicional de Minitab al correr la regresioacuten

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 2861495 715374 102 39 0Er r or 18 125761 6896 7Tot a l 22 2987256

Al nivel de significancia de 005 iquestes la regresioacuten significativa como un todo

13-27 Henry Lander es el director de produccioacuten de la Alecos Corporation de Caracas Venezuela Hede que le ayude a determinar una foacutermula para predecir el ausentismo de los empacadores de chipoacutetesis es que la temperatura diaria promedio puede explicar el porcentaje de ausentismo Durios meses reuacutene datos ejecuta el procedimiento de regresioacuten simple y encuentra que la tempeplica 66 de la variacioacuten en el ausentismo Pero Henry no estaacute convencido de que eacuteste sea un cador satisfactorio Sugiere que la precipitacioacuten pluvial diaria podriacutea tambieacuten tener algo que vausentismo de modo que registra los datos correspondientes y hace una regresioacuten del ausentismte el tiempo de lluvias y obtiene un valor R2 de 059 ldquoiexclEurekardquo grita usted ldquoiexclLo tengo Con uticador que explica 66 y otro que explica 59 todo lo que tengo que hacer es una regresioacutenutilizando ambos y seguramente tendreacute un pronosticador casi perfectordquo Para su desaacutenimo sin la regresioacuten muacuteltiple tiene una R

2 de soacutelo 68 que es solamente un poco mejor que la variablperatura sola iquestCoacutemo puede explicar esta aparente discrepancia

13-28 Juan Armenlegg administrador de Rockyrsquos Diamond y Jewelry Store estaacute interesado en desamodelo para estimar la demanda del consumidor para su costosa mercanciacutea Como la mayoriacutea de

tes compran diamantes y joyas a creacutedito Juan estaacute seguro de que dos factores que deben influirmanda de los clientes son la tasa real de inflacioacuten anual y la tasa real de intereses sobre preacutestamprincipales bancos del paiacutes Explique algunos problemas que Juan podriacutea encontrar si fuera a dun modelo de regresioacuten basado en estas dos variables de prediccioacuten

13-29 Un nuevo programa de juegos Check That Model pide a los concursantes que especifiquen el nuacutenimo de paraacutemetros que necesitan para determinar si un modelo de regresioacuten muacuteltiple es signifimo un todo para ϭ 001 Usted ganoacute la apuesta con 4 paraacutemetros Use la siguiente informacioacutenterminar si la regresioacuten es significativa

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3056

R 2

ϭ 07452

SCE ϭ 1254

n ϭ 18

Nuacutemero de variables independientes ϭ 3

13-30 La Scottish Turist Agency estaacute interesada en el nuacutemero de turistas que entran al paiacutes cada semanrante la temporada alta Se recolectaron los siguientes datos

Turistas (Y ) ϭ nuacutemero de turistas que entran a Escocia en una semana (en miles)

Cambio (X 1)ϭ nuacutemero de libras escocesas compradas por $1 doacutelar

Precio (X 2) ϭ nuacutemero de libras escocesas cobradas por viaje redondo en camioacuten de Londres a Edimburgo

Promoc (X 3) ϭ cantidad gastada en promocioacuten del paiacutes (en miles de libras escocesas)Temp (X 4) ϭ temperatura media durante la semana en Edimburgo (en grados Celsius)

Turistas (Y ) Cambio (X 1) Precio (X 2) Promoc (X 3) Temp (X 4)

69 061 40 87 154

71 059 40 88 156

68 063 40 85 154

79 061 35 86 153

76 060 35 94 158

82 065 35 99 162

80 058 35 98 164

84 059 35 102 166

97 061 30 114 174

98 062 30 116 172

72 057 40 84 176

67 055 40 86 164

a) Utilice el paquete de software que tenga para determinar la ecuacioacuten de regresioacuten que mejote a los datos de la agencia de turismo

b) iquestEs la tasa de cambio una variable explicativa significativa Establezca y pruebe las hipoacutetesidas a un nivel de significancia de 010

c) Un incremento de 1000 libras en las promociones iquestaumenta el nuacutemero de turistas en maacutesEstablezca y pruebe las hipoacutetesis adecuadas para un nivel de significancia de 005

d) Calcule un intervalo de confianza del 95 para el coeficiente de la pendiente de Temp

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-4 Como SCT ϭ SCR ϩ SCE SCE ϭ SCT Ϫ SCR ϭ 10236 Ϫ 8724 ϭ 1512Como gl SCT ϭ gl SCR ϩ gl SCE gl SCR ϭ gl SCT Ϫ gl SCE ϭ 24 Ϫ 17 ϭ 7

Entonces F ϭ ϭ ϭ 1401

F CRiacuteT ϭ F (7 17 005) ϭ 261Como F OBS gt F CRIacuteT se concluye que la regresioacuten es significativa como un todo Edith debe conticando la salida de computadora de la regresioacuten para usarla en la junta

EA 13-5 De la salida de computadora se obti enen los siguientes resultadosa) VENTAS ϭ 17234 ϩ 25950PROMOC Ϫ13238COMPET Ϫ 3041GRATISb) H0 BGRATIS ϭ 0 H1 BGRATIS Ͻ 0 ϭ 005

Eacutesta es una prueba de una cola y el valor prob en los resultados es para la alternativa de dos c BGRATIS 0 De manera que para esta prueba el valor prob es 02212 ϭ 0111 Ͼ ϭ 00que no se puede rechazar H0 las ventas no disminuyen significativamente cuando aumenta ro de pasajeros que vuelan gratis

c) H0 BPROMOC ϭ 28 H1 BPROMOC 28 ϭ 010

87247ᎏᎏ

151217SCRk ᎏᎏ

SCE(n Ϫ k Ϫ 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3156

El valor observado t de los resultados de regresioacuten es

ϭ ϭ Ϫ0420

Con 11 grados de libertad y ϭ 010 en ambas colas combinadas los valores criacuteticos t parba son Ϯ1796 asiacute el valor observado estaacute dentro de la regioacuten de aceptacioacuten No se rechacambio en VENTAS para un incremento de una unidad ($1000) en PROMOC no es significate diferente de 28 ($28000)

d) Con 11 grados de libertad el valor t para un intervalo del 90 de confianza es 1796 por lo

tervalo esbCOMP Ϯ 1796sbCOMP

ϭ Ϫ13238 Ϯ 1796(3686)

ϭ Ϫ13238 Ϯ 6620 ϭ (Ϫ19858 Ϫ 6618)

La liacutenea aeacuterea puede tener una seguridad del 90 de que el ingreso por los boletos en una ofminuye entre $6600 y $19900 aproximadamente con cada liacutenea aeacuterea adicional que comp

135 Teacutecnicas de modelado

Dada una variable que deseamos explicar y un conjunto de variables explicativas potencialehaya varias ecuaciones de regresioacuten diferentes que podamos estudiar dependiendo de queacute explicativas incluyamos y de coacutemo lo hagamos Cada una de esas ecuaciones de regresioacutence como modelo Las teacutecnicas de modelado son las distintas formas en que podemos incluriables explicativas y verificar queacute tan apropiados son los modelos de regresioacuten Existen municas de modelado diferentes pero soacutelo veremos dos de las maacutes utilizadas

Datos cualitativos y variables ficticias

En todos los ejemplos de regresioacuten que hemos visto hasta ahora los datos manejados hanmeacutericos o cuantitativos Pero ocasionalmente nos enfrentaremos con una variable categoacuterilitativa En el problema del inicio el capiacutetulo el director de personal desea ver si el salarioun vendedor depende de su sexo En la tabla 13-5 repetimos los datos de dicho problema

Por el momento ignore la antiguumledad y utilice la teacutecnica desarrollada en el capiacutetulo 9 bar la diferencia entre las medias de dos poblaciones para ver si los hombres ganan maacutes qu

jeres Pruebe con ϭ 001 Si tomamos a los hombres como la poblacioacuten 1 y a las mujerespoblacioacuten 2 probaremos las siguientes hipoacutetesis

H0 1 ϭ 2 larr Hipoacutetesis nula no existe discriminacioacuten por sexo en los salarios base

H1 1 Ͼ 2 larr Hipoacutetesis alternativa se discrimina a las mujeres en su salario base

ϭ 001 larr Nivel de significancia

Revisioacuten del enfoqueanterior del problema

Buacutesqueda dediferentes modelos

25950 Ϫ 28ᎏᎏ

4877

(bPROMOC Ϫ 28)ᎏᎏ

sbPROMOC

Datos para el problemade discriminacioacuten porsexo

Tabla 13-5 Vendedores VendedorasAntiguumledad Salario base Antiguumledad Salario base(en meses) (en miles) (en meses) (en miles)

6 75 5 62

10 86 13 87

12 91 15 94

18 103 21 98

30 130

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3256

A continuacioacuten bosquejamos el anaacutelisis Si tiene problemas para seguirlo deberaacute repasamente la seccioacuten 93

n1 ϭ 5 n2 ϭ 4

x ෆ1 ϭ 97 x ෆ2 ϭ 8525

s2

1 ϭ 4415 s2

2 ϭ 2609

s2

p ϭ

ϭ

ϭ 3641

x ෆ1Ϫ x

ෆ2ϭ s pΊ ϩ

ϭ 128

t ϭ

ϭ

ϭ 092

Con siete grados de libertad el valor t criacutetico para una prueba de cola superior con ϭ 001 eComo el valor t observado de 092 es menor que 2998 no podemos rechazar H0

Entonces el anaacutelisis concluye que no parece haber discriminacioacuten por sexo en los salarPero recuerde que hasta ahora se han ignorado los datos de antiguumledad laboral para el anaacuteli

Antes de seguir vea el diagrama de dispersioacuten de los datos En la figura 13-9 los punto

corresponden a los hombres y los blancos a las mujeres El diagrama de dispersioacuten muestraridad que el salario base aumenta con los antildeos de antiguumledad pero si con la mirada sigue lo qla recta de regresioacuten notaraacute que los puntos negros tienden a estar arriba de ella y los blancos

La figura 13-10 da la salida de una regresioacuten del salario base sobre los meses de antiguumlelos resultados se ve que la antiguumledad es una variable explicativa altamente significativa

Ademaacutes r 2

ϭ 926 que indica que la variable meses de antiguumledad explica cerca del 9variacioacuten en el salario base La figura 13-11 contiene parte de la salida que no se vio antesbla de residuos Para cada punto el residuo es simplemente Y Ϫ Y ˆ que se reconoce como el

Una ldquomiradardquo a los

datos

El enfoque anterior nodetecta discriminacioacuten

(97 ndash 8525) ndash 0ᎏᎏ

128

( x ෆ1 ndash x ෆ2) ndash (1 Ϫ 2)H0

ᎏᎏᎏ

ˆ x ෆ1Ϫ

x ෆ2

1ᎏ

n2

1ᎏ

n1

4(4415) ϩ 3(2609)ᎏᎏᎏ5 ϩ 4 ndash 2

(n1 ndash 1)s21 ϩ (n2 ndash 1)s22ᎏᎏᎏ

n1 ϩ n2 ndash 2

FIGURA 13-9

Diagrama de dis-persioacuten de salariosbase contra mesesde antiguumledad

4 8 12 16 20 24 28

4

8

12

Meses de antiguumledad

S a l a r i o ( m i l e s d e d oacute l a r e s )

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3356

el ajuste de la recta de regresioacuten en ese punto En la figura 13-11 AJUST1 son los valores y RESI1 son los residuos

Tal vez la parte maacutes importante del anaacutelisis del resultado de una regresioacuten sea estusiduos Si la regresioacuten incluye todos los factores explicativos relevantes estos residuo

ser aleatorios Dicho de otro modo si los residuos muestran cualquier patroacuten no aleat

to indica que hay algo sistemaacutetico que afecta el proceso y que no hemos tomado en cu

manera que buscamos patrones en los residuos o para decirlo de forma maacutes pintoresca ldquopmos a los residuos hasta hacerlos hablarrdquo

Si observamos los residuos presentados en la figura 13-11 vemos que los primeros cincoson positivos De modo que para los vendedores tenemos Y ndash Y ˆ Ͼ 0 o Y Ͼ Y ˆ es decir laregresioacuten cae abajo de estos cinco puntos Tres de los cuatro uacuteltimos residuos son negaticonsiguiente para las vendedoras tenemos Y Ϫ Y ˆ Ͻ 0 o Y Ͻ Y ˆ asiacute que la recta de regresicuentra arriba de tres de los cuatro puntos Esto confirma lo que vimos al observar el diagdispersioacuten de la figura 13-9 Este patroacuten no aleatorio en los residuos sugiere que el sexo siacute etor determinante del salario base

iquestCoacutemo podemos incorporar el sexo de los vendedores dentro del modelo de regresioacutencemos utilizando un dispositivo llamado variable ficticia (o variable indicadora) Para lpuntos que representan a los vendedores esta variable tiene valor de 0 y para los cuatro purepresentan a las vendedoras valdraacute 1 Los datos de entrada para nuestra regresioacuten con variticias se dan en la tabla 13-6

Para los datos de la tabla 13-6 se ajusta una regresioacuten de la forma

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

Uso de variablesficticias

Deteccioacuten depatrones en losresiduos

ldquoPresionar a losresiduosrdquo

Anaacutel i s i s de r e gr e s i oacuten

La ec uac i oacuten de r e gr es i oacuten esSALARI O ϭ 5 81 ϩ 0 233 MESES

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t pCons t a nt e 5 8093 0 4038 14 39 0 000MESES 0 23320 0 02492 9 36 0 000

s ϭ 0 5494 R- s q ϭ 92 6

Anaacute l i s i s de va r i a nz aFUENTE GL SC MC F Re gr e s i oacuten 1 26 443 24 443 87 61 0Er r or 7 2 113 0 302Tot a l 8 28 556

FIGURA 13-10

Regresioacuten conMinitab del salariobase sobre losmeses deantiguumledad

RENGLOacuteN SALARI O AJ UST1 RESI 1

1 7 5 7 2085 0 2914992 8 6 8 1413 0 458684

3 9 1 8 6077 0 4922764 10 3 10 0069 0 2930545 13 0 12 8054 0 1946076 6 2 6 9753 - 0 7752977 8 7 8 8409 - 0 1409288 9 4 9 3073 0 0926649 9 8 10 7066 - 0 906558

FIGURA 13-11

Tabla de residuosde Minitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2356

significativa ahora veremos coacutemo decidir si todas las X i tomadas en conjunto explican significavamente la variabilidad observada de Y Nuestras hipoacutetesis son

H0 B1 ϭ B2 ϭ ϭ Bk ϭ 0 larr Hipoacutetesis nula Y no depende de las X i

H1 por lo menos una Bi 0 larr Hipoacutetesis alternativa Y depende de al menos una de las X i

Cuando analizamos r 2 en el capiacutetulo 12 consideramos la variacioacuten total en Y sum(Y Ϫ Y ෆ )2 la p

te de dicha variacioacuten que explica la regresioacuten sum(Y ˆ Ϫ Y ෆ )2 y la parte no explicada de la variacioacutensum(Y Ϫ Y ˆ )2 La figura 13-4 es un duplicado de la figura 12-15 Sirve como repaso de la relacioacuten etre la desviacioacuten total la desviacioacuten explicada y la desviacioacuten no explicada para un solo dato en uregresioacuten simple Aunque no podamos dibujar una figura similar para una regresioacuten muacuteltiple coceptualmente estamos haciendo lo mismo

Al analizar la variacioacuten en Y fijamos nuestra atencioacuten en tres teacuterminos diferentes cada uno de cuales es una suma de cuadrados Los denotamos con

Suma de cuadradosy sus grados delibertad

Anaacutelisis de lavariacioacuten de losvalores Y

FIGURA 13-4

Desviacioacuten totaldesviacioacutenexplicada ydesviacioacuten noexplicada paraun valor observadode Y

Y

X

Un valor observado de lavariable dependiente (Y )

R e c t a d

e r e g r e s

i oacute n

Desviacioacuten no explicada de esta Y respectoa su media Y

(Y ndash Y )^

Desviacioacuten explicada deesta Y respecto a su media Y

(Y ndash Y )^Y

Valor estimado de esta Y

a partir de la recta de regresioacuten (Y )^

Desviacioacuten total de esta Y

respecto a su media Y

(Y ndash Y )

Tres sumas de cuadrados

SCT ϭ suma de cuadrados total (es decir la parte explicada) ϭ sum(Y Ϫ Y ෆ )2

SCR ϭ suma de cuadrados de la regresioacuten (es decir la parte explicada) ϭ sum(Y ˆ Ϫ Y ෆ )2 [13-10

SCE ϭ suma de cuadrados del error (es decir la parte no explicada) ϭ sum(Y Ϫ Y ˆ )2

Estaacuten relacionadas por la ecuacioacuten

que dice que la variacioacuten total en Y puede dividirse en dos partes la parte explicada y la no explicaCada una de estas sumas de cuadrados tiene un nuacutemero asociado de grados de libertad SCT t

ne n Ϫ 1 grados de libertad (n observaciones menos un grado de libertad debido a que la media la muestra estaacute fija) SCR tiene k grados de libertad porque existen k variables independientes qse utilizaron para explicar Y Finalmente SCE tiene n Ϫ k Ϫ 1 grados de libertad porque utilizamnuestras n observaciones para estimar k ϩ 1 constantes a b1 b2 bk Si la hipoacutetesis nula es ci

ta el cociente

Descomposicioacuten de la variacioacuten total de Y

SCT ϭ SCR ϩ SCE [13-1

Cociente F

F ϭ [13-12SCR k ᎏᎏ

SCE(n ndash k ndash 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2456

tiene una distribucioacuten F con k grados de libertad en el numerador y n Ϫ k Ϫ 1 grados de libel denominador Si la hipoacutetesis nula es falsa entonces el cociente tiende a ser maacutes grande qula hipoacutetesis nula es verdadera De modo que si el cociente F es demasiado grande (seguacuten lo na el nivel de significancia de la prueba y el valor apropiado de la tabla 6 del apeacutendice) rechH0 y concluimos que la regresioacuten como un todo es significativa

La figura 13-5 presenta la salida de Minitab para el problema del IRS Esta parte del rincluye los cocientes F calculados para la regresioacuten en ocasiones llamado anaacutelisis de v

(ANOVA) para la regresioacuten Probablemente se pregunte si esto tiene algo que ver con el anaacutelisrianza que estudiamos en el capiacutetulo 11 La respuesta es siacute Aunque no lo hicimos es posibletrar que el anaacutelisis de varianza visto en el capiacutetulo 11 tambieacuten contempla la variacioacuten total las observaciones alrededor de la gran media y la divide en dos partes una explicada por lascias entre los distintos grupos (que corresponde a lo que llamamos varianza entre columnas)

no explicada por dichas diferencias (que corresponde a la varianza dentro de columnas) Estcisamente anaacutelogo a lo que acabamos de hacer en la ecuacioacuten 13-11Para el problema del IRS vemos que SCR ϭ 29109 (con k ϭ 3 grados de libertad) SCE

(con n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad) y que

F ϭ ϭ ϭ 11833

Los elementos en la columna ldquoMCrdquo son justo las sumas de cuadrados divididas entre sus glibertad Para 3 grados de libertad en el numerador y 6 en el denominador la tabla 6 del apeacutence que 978 es el liacutemite superior de la regioacuten de aceptacioacuten para un nivel de significancia El valor calculado de F 11833 estaacute muy por arriba de 978 de manera que se ve que la r

como un todo es altamente significativa Se puede llegar a la misma conclusioacuten si se observresultado del programa dice que ldquo prdquo es 0000 Debido a que este valor prob es menor que elsignificancia ϭ 001 se concluye que la regresioacuten completa es significativa De esta mapuede usar la p de ANOVA como prueba sin tener que utilizar la tabla 6 del apeacutendice para bvalor criacutetico de F Esto es anaacutelogo a la manera en que se usaron los valores de p en la figura ra probar la significancia de las variables explicativas individuales

Multicolinealidad en la regresioacuten muacuteltiple

En el anaacutelisis de regresioacuten muacuteltiple los coeficientes de regresioacuten a menudo se vuelven

confiables conforme aumenta el grado de correlacioacuten entre las variables independie

existe un alto nivel de correlacioacuten entre algunas de las variables independientes nos enfrenun problema que los estadiacutesticos llaman multicolinealidad

La multicolinealidad puede presentarse si deseamos estimar la recuperacioacuten de las ventaempresa y utilizamos tanto el nuacutemero de vendedores empleados como sus salarios totales Cvalores asociados con estas dos variables independientes tienen una correlacioacuten alta neceusar soacutelo un conjunto de ellos para realizar nuestra estimacioacuten De hecho al agregar una segriable que estaacute correlacionada con la primera se distorsionan los valores de los coeficientgresioacuten Sin embargo a menudo podemos predecir bien Y incluso cuando haya multicoline

Consideremos un ejemplo donde existe multicolinealidad para ver coacutemo afecta a la regresrante los 12 meses pasados el gerente del restaurante Pizza Shack ha estado poniendo unaanuncios en el perioacutedico local Los anuncios se programan y pagan el mes anterior a que ap

Un ejemplo demulticolinealidad

Definicioacuten y efecto dela multicolinealidad

9703ᎏ

0082

29109 3ᎏ

0491 6Prueba de lasignificancia de laregresioacuten en elproblema del Serviciode Contribuciones

Anaacutelisis devarianza parala regresioacuten

Prueba F de laregresioacuten como

un todo

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 29 1088 9 7029 118 52 0Er r or 6 0 4912 0 0819Tot al 9 29 6000

FIGURA 13-5Salida de Minitabanaacutelisis devarianza

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2556

Cada anuncio contiene un cupoacuten que permite llevarse dos pizzas pagando solamente la de mcio El gerente recolectoacute los datos de la tabla 13-4 y le gustariacutea utilizarlos para predecir las vpizzas

En las figuras 13-6 y 13-7 se dieron los resultados de Minitab para las regresiones respelas ventas totales sobre el nuacutemero de anuncios y sobre el costo

Para la regresioacuten sobre el nuacutemero de anuncios tenemos que el valor t observado es 395grados de libertad y un nivel de significancia de ϭ 001 se encontroacute que el valor t criacuteticdo de la tabla 2 del apeacutendice) es 3169 Como t o Ͼ t c (o de manera equivalente como p es m001) concluimos que el nuacutemero de anuncios es una variable explicativa altamente signifilas ventas totales Note tambieacuten que r 2 ϭ 610 de modo que el nuacutemero de anuncios explximadamente el 61 de la variacioacuten en las ventas de pizzas

Para la regresioacuten sobre el costo de los anuncios el valor t observado es 454 de modo qude los anuncios es una variable explicativa de las ventas totales todaviacutea maacutes significativa que ro de anuncios (para los que el valor t observado fue soacutelo 395) En esta regresioacuten r 2 ϭ 673

el costo de los anuncios explica aproximadamente el 67 de la variacioacuten de las ventas de pizComo ambas variables explicativas son altamente significativas por siacute mismas intentam

zar ambas en una regresioacuten muacuteltiple El resultado se presenta en la figura 13-8La regresioacuten muacuteltiple es altamente significativa como un todo ya que la p de ANOVA e

Uso de ambas varia-bles explicativas enuna regresioacuten muacuteltiple

Dos regresionessimples

Datos de ventas y anun-cios para el restaurantePizza Shack

Tabla 13-4 X 1 X 2 Y

Nuacutemero Costo de anuncios Venta tode anuncios publicados de pizz

Mes publicados (cientos de doacutelares) (miles de d

Mayo 12 139 436

Junio 11 120 380

Julio 9 93 301

Agosto 7 97 353

Septiembre 12 123 464

Octubre 8 114 342

Noviembre 6 93 302

Diciembre 13 143 407

Enero 8 102 385

Febrero 6 84 226

Marzo 8 112 376

Abril 10 111 352

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esVENTAS = 16 9 + 2 08 ANUNCI OS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 16 937 4 982 3 40 0 007ANUNCI OS 2 0832 0 5271 3 95 0 003

s = 4 206 R- s q = 61 0

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 1 276 31 276 31 15 62 Er r or 10 176 88 17 69Tot a l 11 453 19

Figura 13-6

Regresioacuten de lasventas sobre elnuacutemero deanuncios conMinitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2656

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2756

gar el nuacutemero de anuncios como segunda variable explicativa ademaacutes del costo de los anuncios eplica nada maacutes alrededor del 1 adicional de la variacioacuten de las ventas totales

En este punto es justo preguntarse iquestqueacute variable realmente explica la variacioacuten de las ventotales en la regresioacuten muacuteltiple La respuesta es que ambas la explican pero no podemos separ

sus contribuciones individuales debido a que estaacuten altamente correlacionadas entre siacute E

consecuencia sus coeficientes en la regresioacuten muacuteltiple tienen errores estaacutendar altos valore

calculados relativamente bajos y valores prob Ͼ | t | relativamente altos

iquestDe queacute manera nos afecta esta multicolinealidad Todaviacutea podemos hacer predicciones relativmente precisas cuando se encuentra presente note que para la regresioacuten muacuteltiple (la salida se dala figura 13-8) el error estaacutendar de la estimacioacuten que determina el ancho de los intervalos de co

fianza para las predicciones es 3989 mientras que para la regresioacuten simple con el costo de los anucios como variable explicativa (salida en la figura 13-7) tenemos se ϭ 3849 Lo que no podemhacer es predecir con mucha precisioacuten coacutemo cambiaraacuten las ventas si aumentamos en uno el nuacutemede anuncios La regresioacuten muacuteltiple dice que b1 ϭ 0625 (esto es cada anuncio aumenta las ventotales de pizzas alrededor de $625) pero el error estaacutendar de este coeficiente es 112 (es decir apximadamente $1120)

Las contribucionesindividuales nopueden separarse

Ejercicios 134

Ejercicios de autoevaluacioacuten

EA 13-4 Edith Pratt es una ocupada ejecutiva de una compantildeiacutea de transporte de carga a nivel nacional y va tara una junta porque no encuentra la salida de la regresioacuten muacuteltiple elaborada por un asistente Si la regsioacuten total es significativa al nivel 005 ella desea usar las salida de computadora como evidencia para fudamentar algunas ideas que expondraacute en la reunioacuten Sin embargo su ayudante estaacute enfermo De hectoda la informacioacuten que tiene de la regresioacuten muacuteltiple es un trozo de papel con los siguientes datos

Regresioacuten paraEdith Pratt

SCR 8724 con gl

SCE con 17 gl

SCT 10236 con 24 gl

Como el papel ni siquiera tiene todos los nuacutemeros Edith ha concluido que no es uacutetil Usted sin embardebe saber maacutes que ella iquestPuede Edith entrar en la junta o debe seguir buscando la salida de computador

EA 13-5 Una pequentildea liacutenea aeacuterea de Nueva Inglaterra realizoacute una encuesta sobre sus 15 terminales y obtuvo losguientes datos para el mes de febrero donde

VENTAS ϭ ingreso total seguacuten el nuacutemero de boletos vendidos (en miles de doacutelares)

PROMOCϭ cantidad gastada en promociones de la liacutenea aeacuterea en el aacuterea (en miles de doacutelares)

COMPET ϭ nuacutemero de liacuteneas aeacutereas que compiten en esa terminal

GRATIS ϭ nuacutemero de pasajeros que vuelan gratis (por diferentes razones)

Sugerencia el concepto de hacer infe-rencias respecto a una regresioacuten muacutelti-ple es justo lo mismo que se hizo en elcapiacutetulo 12 cuando hicimos inferencias

respecto a una recta de regresioacuten excepto que ahora se em-

plean dos o maacutes variables independientes Advertencia lamulticolinealidad es un problema que debe manejarse enla regresioacuten muacuteltiple y es necesario desarrollar una com-prensioacuten con sentido comuacuten Recuerde que todaviacutea puedehacer predicciones precisas cuando estaacute presente Pero re-cuerde tambieacuten que no puede decir con mucha precisioacuten

cuaacutento cambiaraacute la variable dependiente si ldquomanipulardquo lavariables independientes Entonces el objetivo debe seminimizar la multicolinealidad Sugerencia la mejor regresioacuten muacuteltiple es la que explica la relacioacuten entre los datos asentildealar la responsabilidad de la mayor proporcioacuten de la va

riacioacuten en la variable dependiente con el menor nuacutemero dvariables independientes Advertencia no es una buenidea incluir demasiadas variables independientes soacutelo porque cuenta con una computadora y un paquete de softwarpara estadiacutestica

SUGERENCIAS

Y

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2856

Ventas (doacutelares) Promoc (doacutelares) Compet Gratis

793 25 10 3

2001 55 8 6

1632 60 12 9

2001 79 7 16

1460 52 8 15

1777 76 12 9

309 20 12 8

2919 90 5 10

1600 40 8 43394 96 5 16

1596 55 11 7

863 30 12 6

2375 60 6 10

1072 50 10 4

1550 35 10 4

a) Utilice la siguiente salida de Minitab para determinar la ecuacioacuten de regresioacuten que mejor se ara la liacutenea aeacuterea

La ec uaci oacuten de r egr es i oacuten esVENTAS ϭ 172 ϩ 25 9 PROMOVϪ 13 2 COMPET Ϫ 3 04 GRATI S

Pr onos t i cador Coef Des vEs t Coci ent e - t Cons t ant e 172 34 51 38 3 35 0PROMOV 25 950 4 877 5 32 0COMPET - 13 238 3 686 - 3 59 0GRATI S - 3 041 2 342 - 1 30 0

b) iquestLos pasajeros que vuelan gratis ocasionan una disminucioacuten significativa en las ventas Fpruebe las hipoacutetesis apropiadas Use ϭ 005

c) iquestUn incremento de $1000 en las promociones cambia las ventas en $28000 o el cambio ecativamente diferente de $28000 Formule y pruebe las hipoacutetesis adecuadas Use ϭ 010

d) Calcule un intervalo de confianza del 90 para el coeficiente de la pendiente de la COMPET

Aplicaciones

13-22 Mark Lowtown publica el perioacutedico Mosquito Junction Enquirer y tiene problemas para predectidad de papel perioacutedico que necesita imprimir diariamente Eligioacute aleatoriamente 27 diacuteas del arior y registroacute la siguiente informacioacuten

PESO ϭ peso en libras de papel perioacutedico para la edicioacuten de ese diacutea

CLASIFICADOS ϭ nuacutemero de anuncios clasificados

PUBLICIDAD ϭ nuacutemero de anuncios publicitarios

PLANA COMPLETA ϭ nuacutemero de anuncios a una plana

Utilizando Minitab para hacer una regresioacuten de PESO sobre las otras tres variables Mark obtuguiente salida

Pr onos t i cador Coef Des vEs t Coci ent e- t Cons t ant e 1072 95 872 43 1 23 0CLASI FI CADOS 0 251 0 126 1 99 0PUBLI CI DAD 1 250 0 884 1 41 0PLANA COMPLETA 250 66 67 92 3 69 0

a) Mark siempre ha pensado que cada anuncio publicitario utiliza al menos 3 libras de papel iquestsioacuten le da una razoacuten significativa para dudar esto al nivel del 5

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2956

b) De manera similar Mark siempre ha creiacutedo que cada anuncio clasificado utiliza aproximmedia libra de papel iquestTiene ahora Mark una razoacuten significativa para dudar esto al nivel del

c) Mark vende espacios de anuncios de plana completa a los comerciantes locales a $30 la paacutegberaacute pensar en ajustar sus tarifas si el papel perioacutedico le cuesta $009 por libra Suponga costos son despreciables Establezca expliacutecitamente las hipoacutetesis y una conclusioacuten (Sugere

jando todo lo demaacutes constante cada anuncio adicional de plana completa tiene un costo de bras de papel ϫ $009 por libra ϭ $2256 El punto de equilibrio es 333333 libras iquestPor quel coeficiente de pendiente para PLANA COMPLETA es significativamente mayor que Mark no estaacute obteniendo ganancias y debe cambiar sus tarifas)

13-23 Para los datos del ejercicio 13-18 y un nivel de significancia de 010 iquestcuaacuteles variables son sign

mente explicativas de los resultados de los exaacutemenes (Habiacutea 12 estudiantes en la muestra) 13-24 Para los datos del ejercicio 13-18 y la siguiente salida de Minitab del procedimiento de regresiple hecho por Bill

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 3134 42 783 60Er r or 7 951 25 135 89Tot a l 11 4085 67

a) iquestCuaacutel es el valor observado de F b) A un nivel de significancia de 005 iquestcuaacutel es el valor criacutetico de F que se debe utilizar para d

si la regresioacuten como un todo es significativac) Basaacutendose en las respuestas a los incisos a) y b) iquestes la regresioacuten significativa como un tod

13-25 Remiacutetase al ejercicio 13-19 A un nivel de significancia de 001 iquestes la variable DISTANCIA uble explicativa significativa para VENTAS

13-26 Para los datos del ejercicio 13-19 y la siguiente salida adicional de Minitab al correr la regresioacuten

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 2861495 715374 102 39 0Er r or 18 125761 6896 7Tot a l 22 2987256

Al nivel de significancia de 005 iquestes la regresioacuten significativa como un todo

13-27 Henry Lander es el director de produccioacuten de la Alecos Corporation de Caracas Venezuela Hede que le ayude a determinar una foacutermula para predecir el ausentismo de los empacadores de chipoacutetesis es que la temperatura diaria promedio puede explicar el porcentaje de ausentismo Durios meses reuacutene datos ejecuta el procedimiento de regresioacuten simple y encuentra que la tempeplica 66 de la variacioacuten en el ausentismo Pero Henry no estaacute convencido de que eacuteste sea un cador satisfactorio Sugiere que la precipitacioacuten pluvial diaria podriacutea tambieacuten tener algo que vausentismo de modo que registra los datos correspondientes y hace una regresioacuten del ausentismte el tiempo de lluvias y obtiene un valor R2 de 059 ldquoiexclEurekardquo grita usted ldquoiexclLo tengo Con uticador que explica 66 y otro que explica 59 todo lo que tengo que hacer es una regresioacutenutilizando ambos y seguramente tendreacute un pronosticador casi perfectordquo Para su desaacutenimo sin la regresioacuten muacuteltiple tiene una R

2 de soacutelo 68 que es solamente un poco mejor que la variablperatura sola iquestCoacutemo puede explicar esta aparente discrepancia

13-28 Juan Armenlegg administrador de Rockyrsquos Diamond y Jewelry Store estaacute interesado en desamodelo para estimar la demanda del consumidor para su costosa mercanciacutea Como la mayoriacutea de

tes compran diamantes y joyas a creacutedito Juan estaacute seguro de que dos factores que deben influirmanda de los clientes son la tasa real de inflacioacuten anual y la tasa real de intereses sobre preacutestamprincipales bancos del paiacutes Explique algunos problemas que Juan podriacutea encontrar si fuera a dun modelo de regresioacuten basado en estas dos variables de prediccioacuten

13-29 Un nuevo programa de juegos Check That Model pide a los concursantes que especifiquen el nuacutenimo de paraacutemetros que necesitan para determinar si un modelo de regresioacuten muacuteltiple es signifimo un todo para ϭ 001 Usted ganoacute la apuesta con 4 paraacutemetros Use la siguiente informacioacutenterminar si la regresioacuten es significativa

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3056

R 2

ϭ 07452

SCE ϭ 1254

n ϭ 18

Nuacutemero de variables independientes ϭ 3

13-30 La Scottish Turist Agency estaacute interesada en el nuacutemero de turistas que entran al paiacutes cada semanrante la temporada alta Se recolectaron los siguientes datos

Turistas (Y ) ϭ nuacutemero de turistas que entran a Escocia en una semana (en miles)

Cambio (X 1)ϭ nuacutemero de libras escocesas compradas por $1 doacutelar

Precio (X 2) ϭ nuacutemero de libras escocesas cobradas por viaje redondo en camioacuten de Londres a Edimburgo

Promoc (X 3) ϭ cantidad gastada en promocioacuten del paiacutes (en miles de libras escocesas)Temp (X 4) ϭ temperatura media durante la semana en Edimburgo (en grados Celsius)

Turistas (Y ) Cambio (X 1) Precio (X 2) Promoc (X 3) Temp (X 4)

69 061 40 87 154

71 059 40 88 156

68 063 40 85 154

79 061 35 86 153

76 060 35 94 158

82 065 35 99 162

80 058 35 98 164

84 059 35 102 166

97 061 30 114 174

98 062 30 116 172

72 057 40 84 176

67 055 40 86 164

a) Utilice el paquete de software que tenga para determinar la ecuacioacuten de regresioacuten que mejote a los datos de la agencia de turismo

b) iquestEs la tasa de cambio una variable explicativa significativa Establezca y pruebe las hipoacutetesidas a un nivel de significancia de 010

c) Un incremento de 1000 libras en las promociones iquestaumenta el nuacutemero de turistas en maacutesEstablezca y pruebe las hipoacutetesis adecuadas para un nivel de significancia de 005

d) Calcule un intervalo de confianza del 95 para el coeficiente de la pendiente de Temp

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-4 Como SCT ϭ SCR ϩ SCE SCE ϭ SCT Ϫ SCR ϭ 10236 Ϫ 8724 ϭ 1512Como gl SCT ϭ gl SCR ϩ gl SCE gl SCR ϭ gl SCT Ϫ gl SCE ϭ 24 Ϫ 17 ϭ 7

Entonces F ϭ ϭ ϭ 1401

F CRiacuteT ϭ F (7 17 005) ϭ 261Como F OBS gt F CRIacuteT se concluye que la regresioacuten es significativa como un todo Edith debe conticando la salida de computadora de la regresioacuten para usarla en la junta

EA 13-5 De la salida de computadora se obti enen los siguientes resultadosa) VENTAS ϭ 17234 ϩ 25950PROMOC Ϫ13238COMPET Ϫ 3041GRATISb) H0 BGRATIS ϭ 0 H1 BGRATIS Ͻ 0 ϭ 005

Eacutesta es una prueba de una cola y el valor prob en los resultados es para la alternativa de dos c BGRATIS 0 De manera que para esta prueba el valor prob es 02212 ϭ 0111 Ͼ ϭ 00que no se puede rechazar H0 las ventas no disminuyen significativamente cuando aumenta ro de pasajeros que vuelan gratis

c) H0 BPROMOC ϭ 28 H1 BPROMOC 28 ϭ 010

87247ᎏᎏ

151217SCRk ᎏᎏ

SCE(n Ϫ k Ϫ 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3156

El valor observado t de los resultados de regresioacuten es

ϭ ϭ Ϫ0420

Con 11 grados de libertad y ϭ 010 en ambas colas combinadas los valores criacuteticos t parba son Ϯ1796 asiacute el valor observado estaacute dentro de la regioacuten de aceptacioacuten No se rechacambio en VENTAS para un incremento de una unidad ($1000) en PROMOC no es significate diferente de 28 ($28000)

d) Con 11 grados de libertad el valor t para un intervalo del 90 de confianza es 1796 por lo

tervalo esbCOMP Ϯ 1796sbCOMP

ϭ Ϫ13238 Ϯ 1796(3686)

ϭ Ϫ13238 Ϯ 6620 ϭ (Ϫ19858 Ϫ 6618)

La liacutenea aeacuterea puede tener una seguridad del 90 de que el ingreso por los boletos en una ofminuye entre $6600 y $19900 aproximadamente con cada liacutenea aeacuterea adicional que comp

135 Teacutecnicas de modelado

Dada una variable que deseamos explicar y un conjunto de variables explicativas potencialehaya varias ecuaciones de regresioacuten diferentes que podamos estudiar dependiendo de queacute explicativas incluyamos y de coacutemo lo hagamos Cada una de esas ecuaciones de regresioacutence como modelo Las teacutecnicas de modelado son las distintas formas en que podemos incluriables explicativas y verificar queacute tan apropiados son los modelos de regresioacuten Existen municas de modelado diferentes pero soacutelo veremos dos de las maacutes utilizadas

Datos cualitativos y variables ficticias

En todos los ejemplos de regresioacuten que hemos visto hasta ahora los datos manejados hanmeacutericos o cuantitativos Pero ocasionalmente nos enfrentaremos con una variable categoacuterilitativa En el problema del inicio el capiacutetulo el director de personal desea ver si el salarioun vendedor depende de su sexo En la tabla 13-5 repetimos los datos de dicho problema

Por el momento ignore la antiguumledad y utilice la teacutecnica desarrollada en el capiacutetulo 9 bar la diferencia entre las medias de dos poblaciones para ver si los hombres ganan maacutes qu

jeres Pruebe con ϭ 001 Si tomamos a los hombres como la poblacioacuten 1 y a las mujerespoblacioacuten 2 probaremos las siguientes hipoacutetesis

H0 1 ϭ 2 larr Hipoacutetesis nula no existe discriminacioacuten por sexo en los salarios base

H1 1 Ͼ 2 larr Hipoacutetesis alternativa se discrimina a las mujeres en su salario base

ϭ 001 larr Nivel de significancia

Revisioacuten del enfoqueanterior del problema

Buacutesqueda dediferentes modelos

25950 Ϫ 28ᎏᎏ

4877

(bPROMOC Ϫ 28)ᎏᎏ

sbPROMOC

Datos para el problemade discriminacioacuten porsexo

Tabla 13-5 Vendedores VendedorasAntiguumledad Salario base Antiguumledad Salario base(en meses) (en miles) (en meses) (en miles)

6 75 5 62

10 86 13 87

12 91 15 94

18 103 21 98

30 130

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3256

A continuacioacuten bosquejamos el anaacutelisis Si tiene problemas para seguirlo deberaacute repasamente la seccioacuten 93

n1 ϭ 5 n2 ϭ 4

x ෆ1 ϭ 97 x ෆ2 ϭ 8525

s2

1 ϭ 4415 s2

2 ϭ 2609

s2

p ϭ

ϭ

ϭ 3641

x ෆ1Ϫ x

ෆ2ϭ s pΊ ϩ

ϭ 128

t ϭ

ϭ

ϭ 092

Con siete grados de libertad el valor t criacutetico para una prueba de cola superior con ϭ 001 eComo el valor t observado de 092 es menor que 2998 no podemos rechazar H0

Entonces el anaacutelisis concluye que no parece haber discriminacioacuten por sexo en los salarPero recuerde que hasta ahora se han ignorado los datos de antiguumledad laboral para el anaacuteli

Antes de seguir vea el diagrama de dispersioacuten de los datos En la figura 13-9 los punto

corresponden a los hombres y los blancos a las mujeres El diagrama de dispersioacuten muestraridad que el salario base aumenta con los antildeos de antiguumledad pero si con la mirada sigue lo qla recta de regresioacuten notaraacute que los puntos negros tienden a estar arriba de ella y los blancos

La figura 13-10 da la salida de una regresioacuten del salario base sobre los meses de antiguumlelos resultados se ve que la antiguumledad es una variable explicativa altamente significativa

Ademaacutes r 2

ϭ 926 que indica que la variable meses de antiguumledad explica cerca del 9variacioacuten en el salario base La figura 13-11 contiene parte de la salida que no se vio antesbla de residuos Para cada punto el residuo es simplemente Y Ϫ Y ˆ que se reconoce como el

Una ldquomiradardquo a los

datos

El enfoque anterior nodetecta discriminacioacuten

(97 ndash 8525) ndash 0ᎏᎏ

128

( x ෆ1 ndash x ෆ2) ndash (1 Ϫ 2)H0

ᎏᎏᎏ

ˆ x ෆ1Ϫ

x ෆ2

1ᎏ

n2

1ᎏ

n1

4(4415) ϩ 3(2609)ᎏᎏᎏ5 ϩ 4 ndash 2

(n1 ndash 1)s21 ϩ (n2 ndash 1)s22ᎏᎏᎏ

n1 ϩ n2 ndash 2

FIGURA 13-9

Diagrama de dis-persioacuten de salariosbase contra mesesde antiguumledad

4 8 12 16 20 24 28

4

8

12

Meses de antiguumledad

S a l a r i o ( m i l e s d e d oacute l a r e s )

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3356

el ajuste de la recta de regresioacuten en ese punto En la figura 13-11 AJUST1 son los valores y RESI1 son los residuos

Tal vez la parte maacutes importante del anaacutelisis del resultado de una regresioacuten sea estusiduos Si la regresioacuten incluye todos los factores explicativos relevantes estos residuo

ser aleatorios Dicho de otro modo si los residuos muestran cualquier patroacuten no aleat

to indica que hay algo sistemaacutetico que afecta el proceso y que no hemos tomado en cu

manera que buscamos patrones en los residuos o para decirlo de forma maacutes pintoresca ldquopmos a los residuos hasta hacerlos hablarrdquo

Si observamos los residuos presentados en la figura 13-11 vemos que los primeros cincoson positivos De modo que para los vendedores tenemos Y ndash Y ˆ Ͼ 0 o Y Ͼ Y ˆ es decir laregresioacuten cae abajo de estos cinco puntos Tres de los cuatro uacuteltimos residuos son negaticonsiguiente para las vendedoras tenemos Y Ϫ Y ˆ Ͻ 0 o Y Ͻ Y ˆ asiacute que la recta de regresicuentra arriba de tres de los cuatro puntos Esto confirma lo que vimos al observar el diagdispersioacuten de la figura 13-9 Este patroacuten no aleatorio en los residuos sugiere que el sexo siacute etor determinante del salario base

iquestCoacutemo podemos incorporar el sexo de los vendedores dentro del modelo de regresioacutencemos utilizando un dispositivo llamado variable ficticia (o variable indicadora) Para lpuntos que representan a los vendedores esta variable tiene valor de 0 y para los cuatro purepresentan a las vendedoras valdraacute 1 Los datos de entrada para nuestra regresioacuten con variticias se dan en la tabla 13-6

Para los datos de la tabla 13-6 se ajusta una regresioacuten de la forma

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

Uso de variablesficticias

Deteccioacuten depatrones en losresiduos

ldquoPresionar a losresiduosrdquo

Anaacutel i s i s de r e gr e s i oacuten

La ec uac i oacuten de r e gr es i oacuten esSALARI O ϭ 5 81 ϩ 0 233 MESES

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t pCons t a nt e 5 8093 0 4038 14 39 0 000MESES 0 23320 0 02492 9 36 0 000

s ϭ 0 5494 R- s q ϭ 92 6

Anaacute l i s i s de va r i a nz aFUENTE GL SC MC F Re gr e s i oacuten 1 26 443 24 443 87 61 0Er r or 7 2 113 0 302Tot a l 8 28 556

FIGURA 13-10

Regresioacuten conMinitab del salariobase sobre losmeses deantiguumledad

RENGLOacuteN SALARI O AJ UST1 RESI 1

1 7 5 7 2085 0 2914992 8 6 8 1413 0 458684

3 9 1 8 6077 0 4922764 10 3 10 0069 0 2930545 13 0 12 8054 0 1946076 6 2 6 9753 - 0 7752977 8 7 8 8409 - 0 1409288 9 4 9 3073 0 0926649 9 8 10 7066 - 0 906558

FIGURA 13-11

Tabla de residuosde Minitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2456

tiene una distribucioacuten F con k grados de libertad en el numerador y n Ϫ k Ϫ 1 grados de libel denominador Si la hipoacutetesis nula es falsa entonces el cociente tiende a ser maacutes grande qula hipoacutetesis nula es verdadera De modo que si el cociente F es demasiado grande (seguacuten lo na el nivel de significancia de la prueba y el valor apropiado de la tabla 6 del apeacutendice) rechH0 y concluimos que la regresioacuten como un todo es significativa

La figura 13-5 presenta la salida de Minitab para el problema del IRS Esta parte del rincluye los cocientes F calculados para la regresioacuten en ocasiones llamado anaacutelisis de v

(ANOVA) para la regresioacuten Probablemente se pregunte si esto tiene algo que ver con el anaacutelisrianza que estudiamos en el capiacutetulo 11 La respuesta es siacute Aunque no lo hicimos es posibletrar que el anaacutelisis de varianza visto en el capiacutetulo 11 tambieacuten contempla la variacioacuten total las observaciones alrededor de la gran media y la divide en dos partes una explicada por lascias entre los distintos grupos (que corresponde a lo que llamamos varianza entre columnas)

no explicada por dichas diferencias (que corresponde a la varianza dentro de columnas) Estcisamente anaacutelogo a lo que acabamos de hacer en la ecuacioacuten 13-11Para el problema del IRS vemos que SCR ϭ 29109 (con k ϭ 3 grados de libertad) SCE

(con n Ϫ k Ϫ 1 ϭ 10 Ϫ 3 Ϫ 1 ϭ 6 grados de libertad) y que

F ϭ ϭ ϭ 11833

Los elementos en la columna ldquoMCrdquo son justo las sumas de cuadrados divididas entre sus glibertad Para 3 grados de libertad en el numerador y 6 en el denominador la tabla 6 del apeacutence que 978 es el liacutemite superior de la regioacuten de aceptacioacuten para un nivel de significancia El valor calculado de F 11833 estaacute muy por arriba de 978 de manera que se ve que la r

como un todo es altamente significativa Se puede llegar a la misma conclusioacuten si se observresultado del programa dice que ldquo prdquo es 0000 Debido a que este valor prob es menor que elsignificancia ϭ 001 se concluye que la regresioacuten completa es significativa De esta mapuede usar la p de ANOVA como prueba sin tener que utilizar la tabla 6 del apeacutendice para bvalor criacutetico de F Esto es anaacutelogo a la manera en que se usaron los valores de p en la figura ra probar la significancia de las variables explicativas individuales

Multicolinealidad en la regresioacuten muacuteltiple

En el anaacutelisis de regresioacuten muacuteltiple los coeficientes de regresioacuten a menudo se vuelven

confiables conforme aumenta el grado de correlacioacuten entre las variables independie

existe un alto nivel de correlacioacuten entre algunas de las variables independientes nos enfrenun problema que los estadiacutesticos llaman multicolinealidad

La multicolinealidad puede presentarse si deseamos estimar la recuperacioacuten de las ventaempresa y utilizamos tanto el nuacutemero de vendedores empleados como sus salarios totales Cvalores asociados con estas dos variables independientes tienen una correlacioacuten alta neceusar soacutelo un conjunto de ellos para realizar nuestra estimacioacuten De hecho al agregar una segriable que estaacute correlacionada con la primera se distorsionan los valores de los coeficientgresioacuten Sin embargo a menudo podemos predecir bien Y incluso cuando haya multicoline

Consideremos un ejemplo donde existe multicolinealidad para ver coacutemo afecta a la regresrante los 12 meses pasados el gerente del restaurante Pizza Shack ha estado poniendo unaanuncios en el perioacutedico local Los anuncios se programan y pagan el mes anterior a que ap

Un ejemplo demulticolinealidad

Definicioacuten y efecto dela multicolinealidad

9703ᎏ

0082

29109 3ᎏ

0491 6Prueba de lasignificancia de laregresioacuten en elproblema del Serviciode Contribuciones

Anaacutelisis devarianza parala regresioacuten

Prueba F de laregresioacuten como

un todo

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 29 1088 9 7029 118 52 0Er r or 6 0 4912 0 0819Tot al 9 29 6000

FIGURA 13-5Salida de Minitabanaacutelisis devarianza

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2556

Cada anuncio contiene un cupoacuten que permite llevarse dos pizzas pagando solamente la de mcio El gerente recolectoacute los datos de la tabla 13-4 y le gustariacutea utilizarlos para predecir las vpizzas

En las figuras 13-6 y 13-7 se dieron los resultados de Minitab para las regresiones respelas ventas totales sobre el nuacutemero de anuncios y sobre el costo

Para la regresioacuten sobre el nuacutemero de anuncios tenemos que el valor t observado es 395grados de libertad y un nivel de significancia de ϭ 001 se encontroacute que el valor t criacuteticdo de la tabla 2 del apeacutendice) es 3169 Como t o Ͼ t c (o de manera equivalente como p es m001) concluimos que el nuacutemero de anuncios es una variable explicativa altamente signifilas ventas totales Note tambieacuten que r 2 ϭ 610 de modo que el nuacutemero de anuncios explximadamente el 61 de la variacioacuten en las ventas de pizzas

Para la regresioacuten sobre el costo de los anuncios el valor t observado es 454 de modo qude los anuncios es una variable explicativa de las ventas totales todaviacutea maacutes significativa que ro de anuncios (para los que el valor t observado fue soacutelo 395) En esta regresioacuten r 2 ϭ 673

el costo de los anuncios explica aproximadamente el 67 de la variacioacuten de las ventas de pizComo ambas variables explicativas son altamente significativas por siacute mismas intentam

zar ambas en una regresioacuten muacuteltiple El resultado se presenta en la figura 13-8La regresioacuten muacuteltiple es altamente significativa como un todo ya que la p de ANOVA e

Uso de ambas varia-bles explicativas enuna regresioacuten muacuteltiple

Dos regresionessimples

Datos de ventas y anun-cios para el restaurantePizza Shack

Tabla 13-4 X 1 X 2 Y

Nuacutemero Costo de anuncios Venta tode anuncios publicados de pizz

Mes publicados (cientos de doacutelares) (miles de d

Mayo 12 139 436

Junio 11 120 380

Julio 9 93 301

Agosto 7 97 353

Septiembre 12 123 464

Octubre 8 114 342

Noviembre 6 93 302

Diciembre 13 143 407

Enero 8 102 385

Febrero 6 84 226

Marzo 8 112 376

Abril 10 111 352

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esVENTAS = 16 9 + 2 08 ANUNCI OS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 16 937 4 982 3 40 0 007ANUNCI OS 2 0832 0 5271 3 95 0 003

s = 4 206 R- s q = 61 0

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 1 276 31 276 31 15 62 Er r or 10 176 88 17 69Tot a l 11 453 19

Figura 13-6

Regresioacuten de lasventas sobre elnuacutemero deanuncios conMinitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2656

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2756

gar el nuacutemero de anuncios como segunda variable explicativa ademaacutes del costo de los anuncios eplica nada maacutes alrededor del 1 adicional de la variacioacuten de las ventas totales

En este punto es justo preguntarse iquestqueacute variable realmente explica la variacioacuten de las ventotales en la regresioacuten muacuteltiple La respuesta es que ambas la explican pero no podemos separ

sus contribuciones individuales debido a que estaacuten altamente correlacionadas entre siacute E

consecuencia sus coeficientes en la regresioacuten muacuteltiple tienen errores estaacutendar altos valore

calculados relativamente bajos y valores prob Ͼ | t | relativamente altos

iquestDe queacute manera nos afecta esta multicolinealidad Todaviacutea podemos hacer predicciones relativmente precisas cuando se encuentra presente note que para la regresioacuten muacuteltiple (la salida se dala figura 13-8) el error estaacutendar de la estimacioacuten que determina el ancho de los intervalos de co

fianza para las predicciones es 3989 mientras que para la regresioacuten simple con el costo de los anucios como variable explicativa (salida en la figura 13-7) tenemos se ϭ 3849 Lo que no podemhacer es predecir con mucha precisioacuten coacutemo cambiaraacuten las ventas si aumentamos en uno el nuacutemede anuncios La regresioacuten muacuteltiple dice que b1 ϭ 0625 (esto es cada anuncio aumenta las ventotales de pizzas alrededor de $625) pero el error estaacutendar de este coeficiente es 112 (es decir apximadamente $1120)

Las contribucionesindividuales nopueden separarse

Ejercicios 134

Ejercicios de autoevaluacioacuten

EA 13-4 Edith Pratt es una ocupada ejecutiva de una compantildeiacutea de transporte de carga a nivel nacional y va tara una junta porque no encuentra la salida de la regresioacuten muacuteltiple elaborada por un asistente Si la regsioacuten total es significativa al nivel 005 ella desea usar las salida de computadora como evidencia para fudamentar algunas ideas que expondraacute en la reunioacuten Sin embargo su ayudante estaacute enfermo De hectoda la informacioacuten que tiene de la regresioacuten muacuteltiple es un trozo de papel con los siguientes datos

Regresioacuten paraEdith Pratt

SCR 8724 con gl

SCE con 17 gl

SCT 10236 con 24 gl

Como el papel ni siquiera tiene todos los nuacutemeros Edith ha concluido que no es uacutetil Usted sin embardebe saber maacutes que ella iquestPuede Edith entrar en la junta o debe seguir buscando la salida de computador

EA 13-5 Una pequentildea liacutenea aeacuterea de Nueva Inglaterra realizoacute una encuesta sobre sus 15 terminales y obtuvo losguientes datos para el mes de febrero donde

VENTAS ϭ ingreso total seguacuten el nuacutemero de boletos vendidos (en miles de doacutelares)

PROMOCϭ cantidad gastada en promociones de la liacutenea aeacuterea en el aacuterea (en miles de doacutelares)

COMPET ϭ nuacutemero de liacuteneas aeacutereas que compiten en esa terminal

GRATIS ϭ nuacutemero de pasajeros que vuelan gratis (por diferentes razones)

Sugerencia el concepto de hacer infe-rencias respecto a una regresioacuten muacutelti-ple es justo lo mismo que se hizo en elcapiacutetulo 12 cuando hicimos inferencias

respecto a una recta de regresioacuten excepto que ahora se em-

plean dos o maacutes variables independientes Advertencia lamulticolinealidad es un problema que debe manejarse enla regresioacuten muacuteltiple y es necesario desarrollar una com-prensioacuten con sentido comuacuten Recuerde que todaviacutea puedehacer predicciones precisas cuando estaacute presente Pero re-cuerde tambieacuten que no puede decir con mucha precisioacuten

cuaacutento cambiaraacute la variable dependiente si ldquomanipulardquo lavariables independientes Entonces el objetivo debe seminimizar la multicolinealidad Sugerencia la mejor regresioacuten muacuteltiple es la que explica la relacioacuten entre los datos asentildealar la responsabilidad de la mayor proporcioacuten de la va

riacioacuten en la variable dependiente con el menor nuacutemero dvariables independientes Advertencia no es una buenidea incluir demasiadas variables independientes soacutelo porque cuenta con una computadora y un paquete de softwarpara estadiacutestica

SUGERENCIAS

Y

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2856

Ventas (doacutelares) Promoc (doacutelares) Compet Gratis

793 25 10 3

2001 55 8 6

1632 60 12 9

2001 79 7 16

1460 52 8 15

1777 76 12 9

309 20 12 8

2919 90 5 10

1600 40 8 43394 96 5 16

1596 55 11 7

863 30 12 6

2375 60 6 10

1072 50 10 4

1550 35 10 4

a) Utilice la siguiente salida de Minitab para determinar la ecuacioacuten de regresioacuten que mejor se ara la liacutenea aeacuterea

La ec uaci oacuten de r egr es i oacuten esVENTAS ϭ 172 ϩ 25 9 PROMOVϪ 13 2 COMPET Ϫ 3 04 GRATI S

Pr onos t i cador Coef Des vEs t Coci ent e - t Cons t ant e 172 34 51 38 3 35 0PROMOV 25 950 4 877 5 32 0COMPET - 13 238 3 686 - 3 59 0GRATI S - 3 041 2 342 - 1 30 0

b) iquestLos pasajeros que vuelan gratis ocasionan una disminucioacuten significativa en las ventas Fpruebe las hipoacutetesis apropiadas Use ϭ 005

c) iquestUn incremento de $1000 en las promociones cambia las ventas en $28000 o el cambio ecativamente diferente de $28000 Formule y pruebe las hipoacutetesis adecuadas Use ϭ 010

d) Calcule un intervalo de confianza del 90 para el coeficiente de la pendiente de la COMPET

Aplicaciones

13-22 Mark Lowtown publica el perioacutedico Mosquito Junction Enquirer y tiene problemas para predectidad de papel perioacutedico que necesita imprimir diariamente Eligioacute aleatoriamente 27 diacuteas del arior y registroacute la siguiente informacioacuten

PESO ϭ peso en libras de papel perioacutedico para la edicioacuten de ese diacutea

CLASIFICADOS ϭ nuacutemero de anuncios clasificados

PUBLICIDAD ϭ nuacutemero de anuncios publicitarios

PLANA COMPLETA ϭ nuacutemero de anuncios a una plana

Utilizando Minitab para hacer una regresioacuten de PESO sobre las otras tres variables Mark obtuguiente salida

Pr onos t i cador Coef Des vEs t Coci ent e- t Cons t ant e 1072 95 872 43 1 23 0CLASI FI CADOS 0 251 0 126 1 99 0PUBLI CI DAD 1 250 0 884 1 41 0PLANA COMPLETA 250 66 67 92 3 69 0

a) Mark siempre ha pensado que cada anuncio publicitario utiliza al menos 3 libras de papel iquestsioacuten le da una razoacuten significativa para dudar esto al nivel del 5

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2956

b) De manera similar Mark siempre ha creiacutedo que cada anuncio clasificado utiliza aproximmedia libra de papel iquestTiene ahora Mark una razoacuten significativa para dudar esto al nivel del

c) Mark vende espacios de anuncios de plana completa a los comerciantes locales a $30 la paacutegberaacute pensar en ajustar sus tarifas si el papel perioacutedico le cuesta $009 por libra Suponga costos son despreciables Establezca expliacutecitamente las hipoacutetesis y una conclusioacuten (Sugere

jando todo lo demaacutes constante cada anuncio adicional de plana completa tiene un costo de bras de papel ϫ $009 por libra ϭ $2256 El punto de equilibrio es 333333 libras iquestPor quel coeficiente de pendiente para PLANA COMPLETA es significativamente mayor que Mark no estaacute obteniendo ganancias y debe cambiar sus tarifas)

13-23 Para los datos del ejercicio 13-18 y un nivel de significancia de 010 iquestcuaacuteles variables son sign

mente explicativas de los resultados de los exaacutemenes (Habiacutea 12 estudiantes en la muestra) 13-24 Para los datos del ejercicio 13-18 y la siguiente salida de Minitab del procedimiento de regresiple hecho por Bill

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 3134 42 783 60Er r or 7 951 25 135 89Tot a l 11 4085 67

a) iquestCuaacutel es el valor observado de F b) A un nivel de significancia de 005 iquestcuaacutel es el valor criacutetico de F que se debe utilizar para d

si la regresioacuten como un todo es significativac) Basaacutendose en las respuestas a los incisos a) y b) iquestes la regresioacuten significativa como un tod

13-25 Remiacutetase al ejercicio 13-19 A un nivel de significancia de 001 iquestes la variable DISTANCIA uble explicativa significativa para VENTAS

13-26 Para los datos del ejercicio 13-19 y la siguiente salida adicional de Minitab al correr la regresioacuten

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 2861495 715374 102 39 0Er r or 18 125761 6896 7Tot a l 22 2987256

Al nivel de significancia de 005 iquestes la regresioacuten significativa como un todo

13-27 Henry Lander es el director de produccioacuten de la Alecos Corporation de Caracas Venezuela Hede que le ayude a determinar una foacutermula para predecir el ausentismo de los empacadores de chipoacutetesis es que la temperatura diaria promedio puede explicar el porcentaje de ausentismo Durios meses reuacutene datos ejecuta el procedimiento de regresioacuten simple y encuentra que la tempeplica 66 de la variacioacuten en el ausentismo Pero Henry no estaacute convencido de que eacuteste sea un cador satisfactorio Sugiere que la precipitacioacuten pluvial diaria podriacutea tambieacuten tener algo que vausentismo de modo que registra los datos correspondientes y hace una regresioacuten del ausentismte el tiempo de lluvias y obtiene un valor R2 de 059 ldquoiexclEurekardquo grita usted ldquoiexclLo tengo Con uticador que explica 66 y otro que explica 59 todo lo que tengo que hacer es una regresioacutenutilizando ambos y seguramente tendreacute un pronosticador casi perfectordquo Para su desaacutenimo sin la regresioacuten muacuteltiple tiene una R

2 de soacutelo 68 que es solamente un poco mejor que la variablperatura sola iquestCoacutemo puede explicar esta aparente discrepancia

13-28 Juan Armenlegg administrador de Rockyrsquos Diamond y Jewelry Store estaacute interesado en desamodelo para estimar la demanda del consumidor para su costosa mercanciacutea Como la mayoriacutea de

tes compran diamantes y joyas a creacutedito Juan estaacute seguro de que dos factores que deben influirmanda de los clientes son la tasa real de inflacioacuten anual y la tasa real de intereses sobre preacutestamprincipales bancos del paiacutes Explique algunos problemas que Juan podriacutea encontrar si fuera a dun modelo de regresioacuten basado en estas dos variables de prediccioacuten

13-29 Un nuevo programa de juegos Check That Model pide a los concursantes que especifiquen el nuacutenimo de paraacutemetros que necesitan para determinar si un modelo de regresioacuten muacuteltiple es signifimo un todo para ϭ 001 Usted ganoacute la apuesta con 4 paraacutemetros Use la siguiente informacioacutenterminar si la regresioacuten es significativa

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3056

R 2

ϭ 07452

SCE ϭ 1254

n ϭ 18

Nuacutemero de variables independientes ϭ 3

13-30 La Scottish Turist Agency estaacute interesada en el nuacutemero de turistas que entran al paiacutes cada semanrante la temporada alta Se recolectaron los siguientes datos

Turistas (Y ) ϭ nuacutemero de turistas que entran a Escocia en una semana (en miles)

Cambio (X 1)ϭ nuacutemero de libras escocesas compradas por $1 doacutelar

Precio (X 2) ϭ nuacutemero de libras escocesas cobradas por viaje redondo en camioacuten de Londres a Edimburgo

Promoc (X 3) ϭ cantidad gastada en promocioacuten del paiacutes (en miles de libras escocesas)Temp (X 4) ϭ temperatura media durante la semana en Edimburgo (en grados Celsius)

Turistas (Y ) Cambio (X 1) Precio (X 2) Promoc (X 3) Temp (X 4)

69 061 40 87 154

71 059 40 88 156

68 063 40 85 154

79 061 35 86 153

76 060 35 94 158

82 065 35 99 162

80 058 35 98 164

84 059 35 102 166

97 061 30 114 174

98 062 30 116 172

72 057 40 84 176

67 055 40 86 164

a) Utilice el paquete de software que tenga para determinar la ecuacioacuten de regresioacuten que mejote a los datos de la agencia de turismo

b) iquestEs la tasa de cambio una variable explicativa significativa Establezca y pruebe las hipoacutetesidas a un nivel de significancia de 010

c) Un incremento de 1000 libras en las promociones iquestaumenta el nuacutemero de turistas en maacutesEstablezca y pruebe las hipoacutetesis adecuadas para un nivel de significancia de 005

d) Calcule un intervalo de confianza del 95 para el coeficiente de la pendiente de Temp

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-4 Como SCT ϭ SCR ϩ SCE SCE ϭ SCT Ϫ SCR ϭ 10236 Ϫ 8724 ϭ 1512Como gl SCT ϭ gl SCR ϩ gl SCE gl SCR ϭ gl SCT Ϫ gl SCE ϭ 24 Ϫ 17 ϭ 7

Entonces F ϭ ϭ ϭ 1401

F CRiacuteT ϭ F (7 17 005) ϭ 261Como F OBS gt F CRIacuteT se concluye que la regresioacuten es significativa como un todo Edith debe conticando la salida de computadora de la regresioacuten para usarla en la junta

EA 13-5 De la salida de computadora se obti enen los siguientes resultadosa) VENTAS ϭ 17234 ϩ 25950PROMOC Ϫ13238COMPET Ϫ 3041GRATISb) H0 BGRATIS ϭ 0 H1 BGRATIS Ͻ 0 ϭ 005

Eacutesta es una prueba de una cola y el valor prob en los resultados es para la alternativa de dos c BGRATIS 0 De manera que para esta prueba el valor prob es 02212 ϭ 0111 Ͼ ϭ 00que no se puede rechazar H0 las ventas no disminuyen significativamente cuando aumenta ro de pasajeros que vuelan gratis

c) H0 BPROMOC ϭ 28 H1 BPROMOC 28 ϭ 010

87247ᎏᎏ

151217SCRk ᎏᎏ

SCE(n Ϫ k Ϫ 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3156

El valor observado t de los resultados de regresioacuten es

ϭ ϭ Ϫ0420

Con 11 grados de libertad y ϭ 010 en ambas colas combinadas los valores criacuteticos t parba son Ϯ1796 asiacute el valor observado estaacute dentro de la regioacuten de aceptacioacuten No se rechacambio en VENTAS para un incremento de una unidad ($1000) en PROMOC no es significate diferente de 28 ($28000)

d) Con 11 grados de libertad el valor t para un intervalo del 90 de confianza es 1796 por lo

tervalo esbCOMP Ϯ 1796sbCOMP

ϭ Ϫ13238 Ϯ 1796(3686)

ϭ Ϫ13238 Ϯ 6620 ϭ (Ϫ19858 Ϫ 6618)

La liacutenea aeacuterea puede tener una seguridad del 90 de que el ingreso por los boletos en una ofminuye entre $6600 y $19900 aproximadamente con cada liacutenea aeacuterea adicional que comp

135 Teacutecnicas de modelado

Dada una variable que deseamos explicar y un conjunto de variables explicativas potencialehaya varias ecuaciones de regresioacuten diferentes que podamos estudiar dependiendo de queacute explicativas incluyamos y de coacutemo lo hagamos Cada una de esas ecuaciones de regresioacutence como modelo Las teacutecnicas de modelado son las distintas formas en que podemos incluriables explicativas y verificar queacute tan apropiados son los modelos de regresioacuten Existen municas de modelado diferentes pero soacutelo veremos dos de las maacutes utilizadas

Datos cualitativos y variables ficticias

En todos los ejemplos de regresioacuten que hemos visto hasta ahora los datos manejados hanmeacutericos o cuantitativos Pero ocasionalmente nos enfrentaremos con una variable categoacuterilitativa En el problema del inicio el capiacutetulo el director de personal desea ver si el salarioun vendedor depende de su sexo En la tabla 13-5 repetimos los datos de dicho problema

Por el momento ignore la antiguumledad y utilice la teacutecnica desarrollada en el capiacutetulo 9 bar la diferencia entre las medias de dos poblaciones para ver si los hombres ganan maacutes qu

jeres Pruebe con ϭ 001 Si tomamos a los hombres como la poblacioacuten 1 y a las mujerespoblacioacuten 2 probaremos las siguientes hipoacutetesis

H0 1 ϭ 2 larr Hipoacutetesis nula no existe discriminacioacuten por sexo en los salarios base

H1 1 Ͼ 2 larr Hipoacutetesis alternativa se discrimina a las mujeres en su salario base

ϭ 001 larr Nivel de significancia

Revisioacuten del enfoqueanterior del problema

Buacutesqueda dediferentes modelos

25950 Ϫ 28ᎏᎏ

4877

(bPROMOC Ϫ 28)ᎏᎏ

sbPROMOC

Datos para el problemade discriminacioacuten porsexo

Tabla 13-5 Vendedores VendedorasAntiguumledad Salario base Antiguumledad Salario base(en meses) (en miles) (en meses) (en miles)

6 75 5 62

10 86 13 87

12 91 15 94

18 103 21 98

30 130

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3256

A continuacioacuten bosquejamos el anaacutelisis Si tiene problemas para seguirlo deberaacute repasamente la seccioacuten 93

n1 ϭ 5 n2 ϭ 4

x ෆ1 ϭ 97 x ෆ2 ϭ 8525

s2

1 ϭ 4415 s2

2 ϭ 2609

s2

p ϭ

ϭ

ϭ 3641

x ෆ1Ϫ x

ෆ2ϭ s pΊ ϩ

ϭ 128

t ϭ

ϭ

ϭ 092

Con siete grados de libertad el valor t criacutetico para una prueba de cola superior con ϭ 001 eComo el valor t observado de 092 es menor que 2998 no podemos rechazar H0

Entonces el anaacutelisis concluye que no parece haber discriminacioacuten por sexo en los salarPero recuerde que hasta ahora se han ignorado los datos de antiguumledad laboral para el anaacuteli

Antes de seguir vea el diagrama de dispersioacuten de los datos En la figura 13-9 los punto

corresponden a los hombres y los blancos a las mujeres El diagrama de dispersioacuten muestraridad que el salario base aumenta con los antildeos de antiguumledad pero si con la mirada sigue lo qla recta de regresioacuten notaraacute que los puntos negros tienden a estar arriba de ella y los blancos

La figura 13-10 da la salida de una regresioacuten del salario base sobre los meses de antiguumlelos resultados se ve que la antiguumledad es una variable explicativa altamente significativa

Ademaacutes r 2

ϭ 926 que indica que la variable meses de antiguumledad explica cerca del 9variacioacuten en el salario base La figura 13-11 contiene parte de la salida que no se vio antesbla de residuos Para cada punto el residuo es simplemente Y Ϫ Y ˆ que se reconoce como el

Una ldquomiradardquo a los

datos

El enfoque anterior nodetecta discriminacioacuten

(97 ndash 8525) ndash 0ᎏᎏ

128

( x ෆ1 ndash x ෆ2) ndash (1 Ϫ 2)H0

ᎏᎏᎏ

ˆ x ෆ1Ϫ

x ෆ2

1ᎏ

n2

1ᎏ

n1

4(4415) ϩ 3(2609)ᎏᎏᎏ5 ϩ 4 ndash 2

(n1 ndash 1)s21 ϩ (n2 ndash 1)s22ᎏᎏᎏ

n1 ϩ n2 ndash 2

FIGURA 13-9

Diagrama de dis-persioacuten de salariosbase contra mesesde antiguumledad

4 8 12 16 20 24 28

4

8

12

Meses de antiguumledad

S a l a r i o ( m i l e s d e d oacute l a r e s )

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3356

el ajuste de la recta de regresioacuten en ese punto En la figura 13-11 AJUST1 son los valores y RESI1 son los residuos

Tal vez la parte maacutes importante del anaacutelisis del resultado de una regresioacuten sea estusiduos Si la regresioacuten incluye todos los factores explicativos relevantes estos residuo

ser aleatorios Dicho de otro modo si los residuos muestran cualquier patroacuten no aleat

to indica que hay algo sistemaacutetico que afecta el proceso y que no hemos tomado en cu

manera que buscamos patrones en los residuos o para decirlo de forma maacutes pintoresca ldquopmos a los residuos hasta hacerlos hablarrdquo

Si observamos los residuos presentados en la figura 13-11 vemos que los primeros cincoson positivos De modo que para los vendedores tenemos Y ndash Y ˆ Ͼ 0 o Y Ͼ Y ˆ es decir laregresioacuten cae abajo de estos cinco puntos Tres de los cuatro uacuteltimos residuos son negaticonsiguiente para las vendedoras tenemos Y Ϫ Y ˆ Ͻ 0 o Y Ͻ Y ˆ asiacute que la recta de regresicuentra arriba de tres de los cuatro puntos Esto confirma lo que vimos al observar el diagdispersioacuten de la figura 13-9 Este patroacuten no aleatorio en los residuos sugiere que el sexo siacute etor determinante del salario base

iquestCoacutemo podemos incorporar el sexo de los vendedores dentro del modelo de regresioacutencemos utilizando un dispositivo llamado variable ficticia (o variable indicadora) Para lpuntos que representan a los vendedores esta variable tiene valor de 0 y para los cuatro purepresentan a las vendedoras valdraacute 1 Los datos de entrada para nuestra regresioacuten con variticias se dan en la tabla 13-6

Para los datos de la tabla 13-6 se ajusta una regresioacuten de la forma

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

Uso de variablesficticias

Deteccioacuten depatrones en losresiduos

ldquoPresionar a losresiduosrdquo

Anaacutel i s i s de r e gr e s i oacuten

La ec uac i oacuten de r e gr es i oacuten esSALARI O ϭ 5 81 ϩ 0 233 MESES

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t pCons t a nt e 5 8093 0 4038 14 39 0 000MESES 0 23320 0 02492 9 36 0 000

s ϭ 0 5494 R- s q ϭ 92 6

Anaacute l i s i s de va r i a nz aFUENTE GL SC MC F Re gr e s i oacuten 1 26 443 24 443 87 61 0Er r or 7 2 113 0 302Tot a l 8 28 556

FIGURA 13-10

Regresioacuten conMinitab del salariobase sobre losmeses deantiguumledad

RENGLOacuteN SALARI O AJ UST1 RESI 1

1 7 5 7 2085 0 2914992 8 6 8 1413 0 458684

3 9 1 8 6077 0 4922764 10 3 10 0069 0 2930545 13 0 12 8054 0 1946076 6 2 6 9753 - 0 7752977 8 7 8 8409 - 0 1409288 9 4 9 3073 0 0926649 9 8 10 7066 - 0 906558

FIGURA 13-11

Tabla de residuosde Minitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2556

Cada anuncio contiene un cupoacuten que permite llevarse dos pizzas pagando solamente la de mcio El gerente recolectoacute los datos de la tabla 13-4 y le gustariacutea utilizarlos para predecir las vpizzas

En las figuras 13-6 y 13-7 se dieron los resultados de Minitab para las regresiones respelas ventas totales sobre el nuacutemero de anuncios y sobre el costo

Para la regresioacuten sobre el nuacutemero de anuncios tenemos que el valor t observado es 395grados de libertad y un nivel de significancia de ϭ 001 se encontroacute que el valor t criacuteticdo de la tabla 2 del apeacutendice) es 3169 Como t o Ͼ t c (o de manera equivalente como p es m001) concluimos que el nuacutemero de anuncios es una variable explicativa altamente signifilas ventas totales Note tambieacuten que r 2 ϭ 610 de modo que el nuacutemero de anuncios explximadamente el 61 de la variacioacuten en las ventas de pizzas

Para la regresioacuten sobre el costo de los anuncios el valor t observado es 454 de modo qude los anuncios es una variable explicativa de las ventas totales todaviacutea maacutes significativa que ro de anuncios (para los que el valor t observado fue soacutelo 395) En esta regresioacuten r 2 ϭ 673

el costo de los anuncios explica aproximadamente el 67 de la variacioacuten de las ventas de pizComo ambas variables explicativas son altamente significativas por siacute mismas intentam

zar ambas en una regresioacuten muacuteltiple El resultado se presenta en la figura 13-8La regresioacuten muacuteltiple es altamente significativa como un todo ya que la p de ANOVA e

Uso de ambas varia-bles explicativas enuna regresioacuten muacuteltiple

Dos regresionessimples

Datos de ventas y anun-cios para el restaurantePizza Shack

Tabla 13-4 X 1 X 2 Y

Nuacutemero Costo de anuncios Venta tode anuncios publicados de pizz

Mes publicados (cientos de doacutelares) (miles de d

Mayo 12 139 436

Junio 11 120 380

Julio 9 93 301

Agosto 7 97 353

Septiembre 12 123 464

Octubre 8 114 342

Noviembre 6 93 302

Diciembre 13 143 407

Enero 8 102 385

Febrero 6 84 226

Marzo 8 112 376

Abril 10 111 352

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esVENTAS = 16 9 + 2 08 ANUNCI OS

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 16 937 4 982 3 40 0 007ANUNCI OS 2 0832 0 5271 3 95 0 003

s = 4 206 R- s q = 61 0

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 1 276 31 276 31 15 62 Er r or 10 176 88 17 69Tot a l 11 453 19

Figura 13-6

Regresioacuten de lasventas sobre elnuacutemero deanuncios conMinitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2656

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2756

gar el nuacutemero de anuncios como segunda variable explicativa ademaacutes del costo de los anuncios eplica nada maacutes alrededor del 1 adicional de la variacioacuten de las ventas totales

En este punto es justo preguntarse iquestqueacute variable realmente explica la variacioacuten de las ventotales en la regresioacuten muacuteltiple La respuesta es que ambas la explican pero no podemos separ

sus contribuciones individuales debido a que estaacuten altamente correlacionadas entre siacute E

consecuencia sus coeficientes en la regresioacuten muacuteltiple tienen errores estaacutendar altos valore

calculados relativamente bajos y valores prob Ͼ | t | relativamente altos

iquestDe queacute manera nos afecta esta multicolinealidad Todaviacutea podemos hacer predicciones relativmente precisas cuando se encuentra presente note que para la regresioacuten muacuteltiple (la salida se dala figura 13-8) el error estaacutendar de la estimacioacuten que determina el ancho de los intervalos de co

fianza para las predicciones es 3989 mientras que para la regresioacuten simple con el costo de los anucios como variable explicativa (salida en la figura 13-7) tenemos se ϭ 3849 Lo que no podemhacer es predecir con mucha precisioacuten coacutemo cambiaraacuten las ventas si aumentamos en uno el nuacutemede anuncios La regresioacuten muacuteltiple dice que b1 ϭ 0625 (esto es cada anuncio aumenta las ventotales de pizzas alrededor de $625) pero el error estaacutendar de este coeficiente es 112 (es decir apximadamente $1120)

Las contribucionesindividuales nopueden separarse

Ejercicios 134

Ejercicios de autoevaluacioacuten

EA 13-4 Edith Pratt es una ocupada ejecutiva de una compantildeiacutea de transporte de carga a nivel nacional y va tara una junta porque no encuentra la salida de la regresioacuten muacuteltiple elaborada por un asistente Si la regsioacuten total es significativa al nivel 005 ella desea usar las salida de computadora como evidencia para fudamentar algunas ideas que expondraacute en la reunioacuten Sin embargo su ayudante estaacute enfermo De hectoda la informacioacuten que tiene de la regresioacuten muacuteltiple es un trozo de papel con los siguientes datos

Regresioacuten paraEdith Pratt

SCR 8724 con gl

SCE con 17 gl

SCT 10236 con 24 gl

Como el papel ni siquiera tiene todos los nuacutemeros Edith ha concluido que no es uacutetil Usted sin embardebe saber maacutes que ella iquestPuede Edith entrar en la junta o debe seguir buscando la salida de computador

EA 13-5 Una pequentildea liacutenea aeacuterea de Nueva Inglaterra realizoacute una encuesta sobre sus 15 terminales y obtuvo losguientes datos para el mes de febrero donde

VENTAS ϭ ingreso total seguacuten el nuacutemero de boletos vendidos (en miles de doacutelares)

PROMOCϭ cantidad gastada en promociones de la liacutenea aeacuterea en el aacuterea (en miles de doacutelares)

COMPET ϭ nuacutemero de liacuteneas aeacutereas que compiten en esa terminal

GRATIS ϭ nuacutemero de pasajeros que vuelan gratis (por diferentes razones)

Sugerencia el concepto de hacer infe-rencias respecto a una regresioacuten muacutelti-ple es justo lo mismo que se hizo en elcapiacutetulo 12 cuando hicimos inferencias

respecto a una recta de regresioacuten excepto que ahora se em-

plean dos o maacutes variables independientes Advertencia lamulticolinealidad es un problema que debe manejarse enla regresioacuten muacuteltiple y es necesario desarrollar una com-prensioacuten con sentido comuacuten Recuerde que todaviacutea puedehacer predicciones precisas cuando estaacute presente Pero re-cuerde tambieacuten que no puede decir con mucha precisioacuten

cuaacutento cambiaraacute la variable dependiente si ldquomanipulardquo lavariables independientes Entonces el objetivo debe seminimizar la multicolinealidad Sugerencia la mejor regresioacuten muacuteltiple es la que explica la relacioacuten entre los datos asentildealar la responsabilidad de la mayor proporcioacuten de la va

riacioacuten en la variable dependiente con el menor nuacutemero dvariables independientes Advertencia no es una buenidea incluir demasiadas variables independientes soacutelo porque cuenta con una computadora y un paquete de softwarpara estadiacutestica

SUGERENCIAS

Y

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2856

Ventas (doacutelares) Promoc (doacutelares) Compet Gratis

793 25 10 3

2001 55 8 6

1632 60 12 9

2001 79 7 16

1460 52 8 15

1777 76 12 9

309 20 12 8

2919 90 5 10

1600 40 8 43394 96 5 16

1596 55 11 7

863 30 12 6

2375 60 6 10

1072 50 10 4

1550 35 10 4

a) Utilice la siguiente salida de Minitab para determinar la ecuacioacuten de regresioacuten que mejor se ara la liacutenea aeacuterea

La ec uaci oacuten de r egr es i oacuten esVENTAS ϭ 172 ϩ 25 9 PROMOVϪ 13 2 COMPET Ϫ 3 04 GRATI S

Pr onos t i cador Coef Des vEs t Coci ent e - t Cons t ant e 172 34 51 38 3 35 0PROMOV 25 950 4 877 5 32 0COMPET - 13 238 3 686 - 3 59 0GRATI S - 3 041 2 342 - 1 30 0

b) iquestLos pasajeros que vuelan gratis ocasionan una disminucioacuten significativa en las ventas Fpruebe las hipoacutetesis apropiadas Use ϭ 005

c) iquestUn incremento de $1000 en las promociones cambia las ventas en $28000 o el cambio ecativamente diferente de $28000 Formule y pruebe las hipoacutetesis adecuadas Use ϭ 010

d) Calcule un intervalo de confianza del 90 para el coeficiente de la pendiente de la COMPET

Aplicaciones

13-22 Mark Lowtown publica el perioacutedico Mosquito Junction Enquirer y tiene problemas para predectidad de papel perioacutedico que necesita imprimir diariamente Eligioacute aleatoriamente 27 diacuteas del arior y registroacute la siguiente informacioacuten

PESO ϭ peso en libras de papel perioacutedico para la edicioacuten de ese diacutea

CLASIFICADOS ϭ nuacutemero de anuncios clasificados

PUBLICIDAD ϭ nuacutemero de anuncios publicitarios

PLANA COMPLETA ϭ nuacutemero de anuncios a una plana

Utilizando Minitab para hacer una regresioacuten de PESO sobre las otras tres variables Mark obtuguiente salida

Pr onos t i cador Coef Des vEs t Coci ent e- t Cons t ant e 1072 95 872 43 1 23 0CLASI FI CADOS 0 251 0 126 1 99 0PUBLI CI DAD 1 250 0 884 1 41 0PLANA COMPLETA 250 66 67 92 3 69 0

a) Mark siempre ha pensado que cada anuncio publicitario utiliza al menos 3 libras de papel iquestsioacuten le da una razoacuten significativa para dudar esto al nivel del 5

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2956

b) De manera similar Mark siempre ha creiacutedo que cada anuncio clasificado utiliza aproximmedia libra de papel iquestTiene ahora Mark una razoacuten significativa para dudar esto al nivel del

c) Mark vende espacios de anuncios de plana completa a los comerciantes locales a $30 la paacutegberaacute pensar en ajustar sus tarifas si el papel perioacutedico le cuesta $009 por libra Suponga costos son despreciables Establezca expliacutecitamente las hipoacutetesis y una conclusioacuten (Sugere

jando todo lo demaacutes constante cada anuncio adicional de plana completa tiene un costo de bras de papel ϫ $009 por libra ϭ $2256 El punto de equilibrio es 333333 libras iquestPor quel coeficiente de pendiente para PLANA COMPLETA es significativamente mayor que Mark no estaacute obteniendo ganancias y debe cambiar sus tarifas)

13-23 Para los datos del ejercicio 13-18 y un nivel de significancia de 010 iquestcuaacuteles variables son sign

mente explicativas de los resultados de los exaacutemenes (Habiacutea 12 estudiantes en la muestra) 13-24 Para los datos del ejercicio 13-18 y la siguiente salida de Minitab del procedimiento de regresiple hecho por Bill

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 3134 42 783 60Er r or 7 951 25 135 89Tot a l 11 4085 67

a) iquestCuaacutel es el valor observado de F b) A un nivel de significancia de 005 iquestcuaacutel es el valor criacutetico de F que se debe utilizar para d

si la regresioacuten como un todo es significativac) Basaacutendose en las respuestas a los incisos a) y b) iquestes la regresioacuten significativa como un tod

13-25 Remiacutetase al ejercicio 13-19 A un nivel de significancia de 001 iquestes la variable DISTANCIA uble explicativa significativa para VENTAS

13-26 Para los datos del ejercicio 13-19 y la siguiente salida adicional de Minitab al correr la regresioacuten

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 2861495 715374 102 39 0Er r or 18 125761 6896 7Tot a l 22 2987256

Al nivel de significancia de 005 iquestes la regresioacuten significativa como un todo

13-27 Henry Lander es el director de produccioacuten de la Alecos Corporation de Caracas Venezuela Hede que le ayude a determinar una foacutermula para predecir el ausentismo de los empacadores de chipoacutetesis es que la temperatura diaria promedio puede explicar el porcentaje de ausentismo Durios meses reuacutene datos ejecuta el procedimiento de regresioacuten simple y encuentra que la tempeplica 66 de la variacioacuten en el ausentismo Pero Henry no estaacute convencido de que eacuteste sea un cador satisfactorio Sugiere que la precipitacioacuten pluvial diaria podriacutea tambieacuten tener algo que vausentismo de modo que registra los datos correspondientes y hace una regresioacuten del ausentismte el tiempo de lluvias y obtiene un valor R2 de 059 ldquoiexclEurekardquo grita usted ldquoiexclLo tengo Con uticador que explica 66 y otro que explica 59 todo lo que tengo que hacer es una regresioacutenutilizando ambos y seguramente tendreacute un pronosticador casi perfectordquo Para su desaacutenimo sin la regresioacuten muacuteltiple tiene una R

2 de soacutelo 68 que es solamente un poco mejor que la variablperatura sola iquestCoacutemo puede explicar esta aparente discrepancia

13-28 Juan Armenlegg administrador de Rockyrsquos Diamond y Jewelry Store estaacute interesado en desamodelo para estimar la demanda del consumidor para su costosa mercanciacutea Como la mayoriacutea de

tes compran diamantes y joyas a creacutedito Juan estaacute seguro de que dos factores que deben influirmanda de los clientes son la tasa real de inflacioacuten anual y la tasa real de intereses sobre preacutestamprincipales bancos del paiacutes Explique algunos problemas que Juan podriacutea encontrar si fuera a dun modelo de regresioacuten basado en estas dos variables de prediccioacuten

13-29 Un nuevo programa de juegos Check That Model pide a los concursantes que especifiquen el nuacutenimo de paraacutemetros que necesitan para determinar si un modelo de regresioacuten muacuteltiple es signifimo un todo para ϭ 001 Usted ganoacute la apuesta con 4 paraacutemetros Use la siguiente informacioacutenterminar si la regresioacuten es significativa

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3056

R 2

ϭ 07452

SCE ϭ 1254

n ϭ 18

Nuacutemero de variables independientes ϭ 3

13-30 La Scottish Turist Agency estaacute interesada en el nuacutemero de turistas que entran al paiacutes cada semanrante la temporada alta Se recolectaron los siguientes datos

Turistas (Y ) ϭ nuacutemero de turistas que entran a Escocia en una semana (en miles)

Cambio (X 1)ϭ nuacutemero de libras escocesas compradas por $1 doacutelar

Precio (X 2) ϭ nuacutemero de libras escocesas cobradas por viaje redondo en camioacuten de Londres a Edimburgo

Promoc (X 3) ϭ cantidad gastada en promocioacuten del paiacutes (en miles de libras escocesas)Temp (X 4) ϭ temperatura media durante la semana en Edimburgo (en grados Celsius)

Turistas (Y ) Cambio (X 1) Precio (X 2) Promoc (X 3) Temp (X 4)

69 061 40 87 154

71 059 40 88 156

68 063 40 85 154

79 061 35 86 153

76 060 35 94 158

82 065 35 99 162

80 058 35 98 164

84 059 35 102 166

97 061 30 114 174

98 062 30 116 172

72 057 40 84 176

67 055 40 86 164

a) Utilice el paquete de software que tenga para determinar la ecuacioacuten de regresioacuten que mejote a los datos de la agencia de turismo

b) iquestEs la tasa de cambio una variable explicativa significativa Establezca y pruebe las hipoacutetesidas a un nivel de significancia de 010

c) Un incremento de 1000 libras en las promociones iquestaumenta el nuacutemero de turistas en maacutesEstablezca y pruebe las hipoacutetesis adecuadas para un nivel de significancia de 005

d) Calcule un intervalo de confianza del 95 para el coeficiente de la pendiente de Temp

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-4 Como SCT ϭ SCR ϩ SCE SCE ϭ SCT Ϫ SCR ϭ 10236 Ϫ 8724 ϭ 1512Como gl SCT ϭ gl SCR ϩ gl SCE gl SCR ϭ gl SCT Ϫ gl SCE ϭ 24 Ϫ 17 ϭ 7

Entonces F ϭ ϭ ϭ 1401

F CRiacuteT ϭ F (7 17 005) ϭ 261Como F OBS gt F CRIacuteT se concluye que la regresioacuten es significativa como un todo Edith debe conticando la salida de computadora de la regresioacuten para usarla en la junta

EA 13-5 De la salida de computadora se obti enen los siguientes resultadosa) VENTAS ϭ 17234 ϩ 25950PROMOC Ϫ13238COMPET Ϫ 3041GRATISb) H0 BGRATIS ϭ 0 H1 BGRATIS Ͻ 0 ϭ 005

Eacutesta es una prueba de una cola y el valor prob en los resultados es para la alternativa de dos c BGRATIS 0 De manera que para esta prueba el valor prob es 02212 ϭ 0111 Ͼ ϭ 00que no se puede rechazar H0 las ventas no disminuyen significativamente cuando aumenta ro de pasajeros que vuelan gratis

c) H0 BPROMOC ϭ 28 H1 BPROMOC 28 ϭ 010

87247ᎏᎏ

151217SCRk ᎏᎏ

SCE(n Ϫ k Ϫ 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3156

El valor observado t de los resultados de regresioacuten es

ϭ ϭ Ϫ0420

Con 11 grados de libertad y ϭ 010 en ambas colas combinadas los valores criacuteticos t parba son Ϯ1796 asiacute el valor observado estaacute dentro de la regioacuten de aceptacioacuten No se rechacambio en VENTAS para un incremento de una unidad ($1000) en PROMOC no es significate diferente de 28 ($28000)

d) Con 11 grados de libertad el valor t para un intervalo del 90 de confianza es 1796 por lo

tervalo esbCOMP Ϯ 1796sbCOMP

ϭ Ϫ13238 Ϯ 1796(3686)

ϭ Ϫ13238 Ϯ 6620 ϭ (Ϫ19858 Ϫ 6618)

La liacutenea aeacuterea puede tener una seguridad del 90 de que el ingreso por los boletos en una ofminuye entre $6600 y $19900 aproximadamente con cada liacutenea aeacuterea adicional que comp

135 Teacutecnicas de modelado

Dada una variable que deseamos explicar y un conjunto de variables explicativas potencialehaya varias ecuaciones de regresioacuten diferentes que podamos estudiar dependiendo de queacute explicativas incluyamos y de coacutemo lo hagamos Cada una de esas ecuaciones de regresioacutence como modelo Las teacutecnicas de modelado son las distintas formas en que podemos incluriables explicativas y verificar queacute tan apropiados son los modelos de regresioacuten Existen municas de modelado diferentes pero soacutelo veremos dos de las maacutes utilizadas

Datos cualitativos y variables ficticias

En todos los ejemplos de regresioacuten que hemos visto hasta ahora los datos manejados hanmeacutericos o cuantitativos Pero ocasionalmente nos enfrentaremos con una variable categoacuterilitativa En el problema del inicio el capiacutetulo el director de personal desea ver si el salarioun vendedor depende de su sexo En la tabla 13-5 repetimos los datos de dicho problema

Por el momento ignore la antiguumledad y utilice la teacutecnica desarrollada en el capiacutetulo 9 bar la diferencia entre las medias de dos poblaciones para ver si los hombres ganan maacutes qu

jeres Pruebe con ϭ 001 Si tomamos a los hombres como la poblacioacuten 1 y a las mujerespoblacioacuten 2 probaremos las siguientes hipoacutetesis

H0 1 ϭ 2 larr Hipoacutetesis nula no existe discriminacioacuten por sexo en los salarios base

H1 1 Ͼ 2 larr Hipoacutetesis alternativa se discrimina a las mujeres en su salario base

ϭ 001 larr Nivel de significancia

Revisioacuten del enfoqueanterior del problema

Buacutesqueda dediferentes modelos

25950 Ϫ 28ᎏᎏ

4877

(bPROMOC Ϫ 28)ᎏᎏ

sbPROMOC

Datos para el problemade discriminacioacuten porsexo

Tabla 13-5 Vendedores VendedorasAntiguumledad Salario base Antiguumledad Salario base(en meses) (en miles) (en meses) (en miles)

6 75 5 62

10 86 13 87

12 91 15 94

18 103 21 98

30 130

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3256

A continuacioacuten bosquejamos el anaacutelisis Si tiene problemas para seguirlo deberaacute repasamente la seccioacuten 93

n1 ϭ 5 n2 ϭ 4

x ෆ1 ϭ 97 x ෆ2 ϭ 8525

s2

1 ϭ 4415 s2

2 ϭ 2609

s2

p ϭ

ϭ

ϭ 3641

x ෆ1Ϫ x

ෆ2ϭ s pΊ ϩ

ϭ 128

t ϭ

ϭ

ϭ 092

Con siete grados de libertad el valor t criacutetico para una prueba de cola superior con ϭ 001 eComo el valor t observado de 092 es menor que 2998 no podemos rechazar H0

Entonces el anaacutelisis concluye que no parece haber discriminacioacuten por sexo en los salarPero recuerde que hasta ahora se han ignorado los datos de antiguumledad laboral para el anaacuteli

Antes de seguir vea el diagrama de dispersioacuten de los datos En la figura 13-9 los punto

corresponden a los hombres y los blancos a las mujeres El diagrama de dispersioacuten muestraridad que el salario base aumenta con los antildeos de antiguumledad pero si con la mirada sigue lo qla recta de regresioacuten notaraacute que los puntos negros tienden a estar arriba de ella y los blancos

La figura 13-10 da la salida de una regresioacuten del salario base sobre los meses de antiguumlelos resultados se ve que la antiguumledad es una variable explicativa altamente significativa

Ademaacutes r 2

ϭ 926 que indica que la variable meses de antiguumledad explica cerca del 9variacioacuten en el salario base La figura 13-11 contiene parte de la salida que no se vio antesbla de residuos Para cada punto el residuo es simplemente Y Ϫ Y ˆ que se reconoce como el

Una ldquomiradardquo a los

datos

El enfoque anterior nodetecta discriminacioacuten

(97 ndash 8525) ndash 0ᎏᎏ

128

( x ෆ1 ndash x ෆ2) ndash (1 Ϫ 2)H0

ᎏᎏᎏ

ˆ x ෆ1Ϫ

x ෆ2

1ᎏ

n2

1ᎏ

n1

4(4415) ϩ 3(2609)ᎏᎏᎏ5 ϩ 4 ndash 2

(n1 ndash 1)s21 ϩ (n2 ndash 1)s22ᎏᎏᎏ

n1 ϩ n2 ndash 2

FIGURA 13-9

Diagrama de dis-persioacuten de salariosbase contra mesesde antiguumledad

4 8 12 16 20 24 28

4

8

12

Meses de antiguumledad

S a l a r i o ( m i l e s d e d oacute l a r e s )

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3356

el ajuste de la recta de regresioacuten en ese punto En la figura 13-11 AJUST1 son los valores y RESI1 son los residuos

Tal vez la parte maacutes importante del anaacutelisis del resultado de una regresioacuten sea estusiduos Si la regresioacuten incluye todos los factores explicativos relevantes estos residuo

ser aleatorios Dicho de otro modo si los residuos muestran cualquier patroacuten no aleat

to indica que hay algo sistemaacutetico que afecta el proceso y que no hemos tomado en cu

manera que buscamos patrones en los residuos o para decirlo de forma maacutes pintoresca ldquopmos a los residuos hasta hacerlos hablarrdquo

Si observamos los residuos presentados en la figura 13-11 vemos que los primeros cincoson positivos De modo que para los vendedores tenemos Y ndash Y ˆ Ͼ 0 o Y Ͼ Y ˆ es decir laregresioacuten cae abajo de estos cinco puntos Tres de los cuatro uacuteltimos residuos son negaticonsiguiente para las vendedoras tenemos Y Ϫ Y ˆ Ͻ 0 o Y Ͻ Y ˆ asiacute que la recta de regresicuentra arriba de tres de los cuatro puntos Esto confirma lo que vimos al observar el diagdispersioacuten de la figura 13-9 Este patroacuten no aleatorio en los residuos sugiere que el sexo siacute etor determinante del salario base

iquestCoacutemo podemos incorporar el sexo de los vendedores dentro del modelo de regresioacutencemos utilizando un dispositivo llamado variable ficticia (o variable indicadora) Para lpuntos que representan a los vendedores esta variable tiene valor de 0 y para los cuatro purepresentan a las vendedoras valdraacute 1 Los datos de entrada para nuestra regresioacuten con variticias se dan en la tabla 13-6

Para los datos de la tabla 13-6 se ajusta una regresioacuten de la forma

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

Uso de variablesficticias

Deteccioacuten depatrones en losresiduos

ldquoPresionar a losresiduosrdquo

Anaacutel i s i s de r e gr e s i oacuten

La ec uac i oacuten de r e gr es i oacuten esSALARI O ϭ 5 81 ϩ 0 233 MESES

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t pCons t a nt e 5 8093 0 4038 14 39 0 000MESES 0 23320 0 02492 9 36 0 000

s ϭ 0 5494 R- s q ϭ 92 6

Anaacute l i s i s de va r i a nz aFUENTE GL SC MC F Re gr e s i oacuten 1 26 443 24 443 87 61 0Er r or 7 2 113 0 302Tot a l 8 28 556

FIGURA 13-10

Regresioacuten conMinitab del salariobase sobre losmeses deantiguumledad

RENGLOacuteN SALARI O AJ UST1 RESI 1

1 7 5 7 2085 0 2914992 8 6 8 1413 0 458684

3 9 1 8 6077 0 4922764 10 3 10 0069 0 2930545 13 0 12 8054 0 1946076 6 2 6 9753 - 0 7752977 8 7 8 8409 - 0 1409288 9 4 9 3073 0 0926649 9 8 10 7066 - 0 906558

FIGURA 13-11

Tabla de residuosde Minitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2656

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2756

gar el nuacutemero de anuncios como segunda variable explicativa ademaacutes del costo de los anuncios eplica nada maacutes alrededor del 1 adicional de la variacioacuten de las ventas totales

En este punto es justo preguntarse iquestqueacute variable realmente explica la variacioacuten de las ventotales en la regresioacuten muacuteltiple La respuesta es que ambas la explican pero no podemos separ

sus contribuciones individuales debido a que estaacuten altamente correlacionadas entre siacute E

consecuencia sus coeficientes en la regresioacuten muacuteltiple tienen errores estaacutendar altos valore

calculados relativamente bajos y valores prob Ͼ | t | relativamente altos

iquestDe queacute manera nos afecta esta multicolinealidad Todaviacutea podemos hacer predicciones relativmente precisas cuando se encuentra presente note que para la regresioacuten muacuteltiple (la salida se dala figura 13-8) el error estaacutendar de la estimacioacuten que determina el ancho de los intervalos de co

fianza para las predicciones es 3989 mientras que para la regresioacuten simple con el costo de los anucios como variable explicativa (salida en la figura 13-7) tenemos se ϭ 3849 Lo que no podemhacer es predecir con mucha precisioacuten coacutemo cambiaraacuten las ventas si aumentamos en uno el nuacutemede anuncios La regresioacuten muacuteltiple dice que b1 ϭ 0625 (esto es cada anuncio aumenta las ventotales de pizzas alrededor de $625) pero el error estaacutendar de este coeficiente es 112 (es decir apximadamente $1120)

Las contribucionesindividuales nopueden separarse

Ejercicios 134

Ejercicios de autoevaluacioacuten

EA 13-4 Edith Pratt es una ocupada ejecutiva de una compantildeiacutea de transporte de carga a nivel nacional y va tara una junta porque no encuentra la salida de la regresioacuten muacuteltiple elaborada por un asistente Si la regsioacuten total es significativa al nivel 005 ella desea usar las salida de computadora como evidencia para fudamentar algunas ideas que expondraacute en la reunioacuten Sin embargo su ayudante estaacute enfermo De hectoda la informacioacuten que tiene de la regresioacuten muacuteltiple es un trozo de papel con los siguientes datos

Regresioacuten paraEdith Pratt

SCR 8724 con gl

SCE con 17 gl

SCT 10236 con 24 gl

Como el papel ni siquiera tiene todos los nuacutemeros Edith ha concluido que no es uacutetil Usted sin embardebe saber maacutes que ella iquestPuede Edith entrar en la junta o debe seguir buscando la salida de computador

EA 13-5 Una pequentildea liacutenea aeacuterea de Nueva Inglaterra realizoacute una encuesta sobre sus 15 terminales y obtuvo losguientes datos para el mes de febrero donde

VENTAS ϭ ingreso total seguacuten el nuacutemero de boletos vendidos (en miles de doacutelares)

PROMOCϭ cantidad gastada en promociones de la liacutenea aeacuterea en el aacuterea (en miles de doacutelares)

COMPET ϭ nuacutemero de liacuteneas aeacutereas que compiten en esa terminal

GRATIS ϭ nuacutemero de pasajeros que vuelan gratis (por diferentes razones)

Sugerencia el concepto de hacer infe-rencias respecto a una regresioacuten muacutelti-ple es justo lo mismo que se hizo en elcapiacutetulo 12 cuando hicimos inferencias

respecto a una recta de regresioacuten excepto que ahora se em-

plean dos o maacutes variables independientes Advertencia lamulticolinealidad es un problema que debe manejarse enla regresioacuten muacuteltiple y es necesario desarrollar una com-prensioacuten con sentido comuacuten Recuerde que todaviacutea puedehacer predicciones precisas cuando estaacute presente Pero re-cuerde tambieacuten que no puede decir con mucha precisioacuten

cuaacutento cambiaraacute la variable dependiente si ldquomanipulardquo lavariables independientes Entonces el objetivo debe seminimizar la multicolinealidad Sugerencia la mejor regresioacuten muacuteltiple es la que explica la relacioacuten entre los datos asentildealar la responsabilidad de la mayor proporcioacuten de la va

riacioacuten en la variable dependiente con el menor nuacutemero dvariables independientes Advertencia no es una buenidea incluir demasiadas variables independientes soacutelo porque cuenta con una computadora y un paquete de softwarpara estadiacutestica

SUGERENCIAS

Y

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2856

Ventas (doacutelares) Promoc (doacutelares) Compet Gratis

793 25 10 3

2001 55 8 6

1632 60 12 9

2001 79 7 16

1460 52 8 15

1777 76 12 9

309 20 12 8

2919 90 5 10

1600 40 8 43394 96 5 16

1596 55 11 7

863 30 12 6

2375 60 6 10

1072 50 10 4

1550 35 10 4

a) Utilice la siguiente salida de Minitab para determinar la ecuacioacuten de regresioacuten que mejor se ara la liacutenea aeacuterea

La ec uaci oacuten de r egr es i oacuten esVENTAS ϭ 172 ϩ 25 9 PROMOVϪ 13 2 COMPET Ϫ 3 04 GRATI S

Pr onos t i cador Coef Des vEs t Coci ent e - t Cons t ant e 172 34 51 38 3 35 0PROMOV 25 950 4 877 5 32 0COMPET - 13 238 3 686 - 3 59 0GRATI S - 3 041 2 342 - 1 30 0

b) iquestLos pasajeros que vuelan gratis ocasionan una disminucioacuten significativa en las ventas Fpruebe las hipoacutetesis apropiadas Use ϭ 005

c) iquestUn incremento de $1000 en las promociones cambia las ventas en $28000 o el cambio ecativamente diferente de $28000 Formule y pruebe las hipoacutetesis adecuadas Use ϭ 010

d) Calcule un intervalo de confianza del 90 para el coeficiente de la pendiente de la COMPET

Aplicaciones

13-22 Mark Lowtown publica el perioacutedico Mosquito Junction Enquirer y tiene problemas para predectidad de papel perioacutedico que necesita imprimir diariamente Eligioacute aleatoriamente 27 diacuteas del arior y registroacute la siguiente informacioacuten

PESO ϭ peso en libras de papel perioacutedico para la edicioacuten de ese diacutea

CLASIFICADOS ϭ nuacutemero de anuncios clasificados

PUBLICIDAD ϭ nuacutemero de anuncios publicitarios

PLANA COMPLETA ϭ nuacutemero de anuncios a una plana

Utilizando Minitab para hacer una regresioacuten de PESO sobre las otras tres variables Mark obtuguiente salida

Pr onos t i cador Coef Des vEs t Coci ent e- t Cons t ant e 1072 95 872 43 1 23 0CLASI FI CADOS 0 251 0 126 1 99 0PUBLI CI DAD 1 250 0 884 1 41 0PLANA COMPLETA 250 66 67 92 3 69 0

a) Mark siempre ha pensado que cada anuncio publicitario utiliza al menos 3 libras de papel iquestsioacuten le da una razoacuten significativa para dudar esto al nivel del 5

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2956

b) De manera similar Mark siempre ha creiacutedo que cada anuncio clasificado utiliza aproximmedia libra de papel iquestTiene ahora Mark una razoacuten significativa para dudar esto al nivel del

c) Mark vende espacios de anuncios de plana completa a los comerciantes locales a $30 la paacutegberaacute pensar en ajustar sus tarifas si el papel perioacutedico le cuesta $009 por libra Suponga costos son despreciables Establezca expliacutecitamente las hipoacutetesis y una conclusioacuten (Sugere

jando todo lo demaacutes constante cada anuncio adicional de plana completa tiene un costo de bras de papel ϫ $009 por libra ϭ $2256 El punto de equilibrio es 333333 libras iquestPor quel coeficiente de pendiente para PLANA COMPLETA es significativamente mayor que Mark no estaacute obteniendo ganancias y debe cambiar sus tarifas)

13-23 Para los datos del ejercicio 13-18 y un nivel de significancia de 010 iquestcuaacuteles variables son sign

mente explicativas de los resultados de los exaacutemenes (Habiacutea 12 estudiantes en la muestra) 13-24 Para los datos del ejercicio 13-18 y la siguiente salida de Minitab del procedimiento de regresiple hecho por Bill

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 3134 42 783 60Er r or 7 951 25 135 89Tot a l 11 4085 67

a) iquestCuaacutel es el valor observado de F b) A un nivel de significancia de 005 iquestcuaacutel es el valor criacutetico de F que se debe utilizar para d

si la regresioacuten como un todo es significativac) Basaacutendose en las respuestas a los incisos a) y b) iquestes la regresioacuten significativa como un tod

13-25 Remiacutetase al ejercicio 13-19 A un nivel de significancia de 001 iquestes la variable DISTANCIA uble explicativa significativa para VENTAS

13-26 Para los datos del ejercicio 13-19 y la siguiente salida adicional de Minitab al correr la regresioacuten

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 2861495 715374 102 39 0Er r or 18 125761 6896 7Tot a l 22 2987256

Al nivel de significancia de 005 iquestes la regresioacuten significativa como un todo

13-27 Henry Lander es el director de produccioacuten de la Alecos Corporation de Caracas Venezuela Hede que le ayude a determinar una foacutermula para predecir el ausentismo de los empacadores de chipoacutetesis es que la temperatura diaria promedio puede explicar el porcentaje de ausentismo Durios meses reuacutene datos ejecuta el procedimiento de regresioacuten simple y encuentra que la tempeplica 66 de la variacioacuten en el ausentismo Pero Henry no estaacute convencido de que eacuteste sea un cador satisfactorio Sugiere que la precipitacioacuten pluvial diaria podriacutea tambieacuten tener algo que vausentismo de modo que registra los datos correspondientes y hace una regresioacuten del ausentismte el tiempo de lluvias y obtiene un valor R2 de 059 ldquoiexclEurekardquo grita usted ldquoiexclLo tengo Con uticador que explica 66 y otro que explica 59 todo lo que tengo que hacer es una regresioacutenutilizando ambos y seguramente tendreacute un pronosticador casi perfectordquo Para su desaacutenimo sin la regresioacuten muacuteltiple tiene una R

2 de soacutelo 68 que es solamente un poco mejor que la variablperatura sola iquestCoacutemo puede explicar esta aparente discrepancia

13-28 Juan Armenlegg administrador de Rockyrsquos Diamond y Jewelry Store estaacute interesado en desamodelo para estimar la demanda del consumidor para su costosa mercanciacutea Como la mayoriacutea de

tes compran diamantes y joyas a creacutedito Juan estaacute seguro de que dos factores que deben influirmanda de los clientes son la tasa real de inflacioacuten anual y la tasa real de intereses sobre preacutestamprincipales bancos del paiacutes Explique algunos problemas que Juan podriacutea encontrar si fuera a dun modelo de regresioacuten basado en estas dos variables de prediccioacuten

13-29 Un nuevo programa de juegos Check That Model pide a los concursantes que especifiquen el nuacutenimo de paraacutemetros que necesitan para determinar si un modelo de regresioacuten muacuteltiple es signifimo un todo para ϭ 001 Usted ganoacute la apuesta con 4 paraacutemetros Use la siguiente informacioacutenterminar si la regresioacuten es significativa

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3056

R 2

ϭ 07452

SCE ϭ 1254

n ϭ 18

Nuacutemero de variables independientes ϭ 3

13-30 La Scottish Turist Agency estaacute interesada en el nuacutemero de turistas que entran al paiacutes cada semanrante la temporada alta Se recolectaron los siguientes datos

Turistas (Y ) ϭ nuacutemero de turistas que entran a Escocia en una semana (en miles)

Cambio (X 1)ϭ nuacutemero de libras escocesas compradas por $1 doacutelar

Precio (X 2) ϭ nuacutemero de libras escocesas cobradas por viaje redondo en camioacuten de Londres a Edimburgo

Promoc (X 3) ϭ cantidad gastada en promocioacuten del paiacutes (en miles de libras escocesas)Temp (X 4) ϭ temperatura media durante la semana en Edimburgo (en grados Celsius)

Turistas (Y ) Cambio (X 1) Precio (X 2) Promoc (X 3) Temp (X 4)

69 061 40 87 154

71 059 40 88 156

68 063 40 85 154

79 061 35 86 153

76 060 35 94 158

82 065 35 99 162

80 058 35 98 164

84 059 35 102 166

97 061 30 114 174

98 062 30 116 172

72 057 40 84 176

67 055 40 86 164

a) Utilice el paquete de software que tenga para determinar la ecuacioacuten de regresioacuten que mejote a los datos de la agencia de turismo

b) iquestEs la tasa de cambio una variable explicativa significativa Establezca y pruebe las hipoacutetesidas a un nivel de significancia de 010

c) Un incremento de 1000 libras en las promociones iquestaumenta el nuacutemero de turistas en maacutesEstablezca y pruebe las hipoacutetesis adecuadas para un nivel de significancia de 005

d) Calcule un intervalo de confianza del 95 para el coeficiente de la pendiente de Temp

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-4 Como SCT ϭ SCR ϩ SCE SCE ϭ SCT Ϫ SCR ϭ 10236 Ϫ 8724 ϭ 1512Como gl SCT ϭ gl SCR ϩ gl SCE gl SCR ϭ gl SCT Ϫ gl SCE ϭ 24 Ϫ 17 ϭ 7

Entonces F ϭ ϭ ϭ 1401

F CRiacuteT ϭ F (7 17 005) ϭ 261Como F OBS gt F CRIacuteT se concluye que la regresioacuten es significativa como un todo Edith debe conticando la salida de computadora de la regresioacuten para usarla en la junta

EA 13-5 De la salida de computadora se obti enen los siguientes resultadosa) VENTAS ϭ 17234 ϩ 25950PROMOC Ϫ13238COMPET Ϫ 3041GRATISb) H0 BGRATIS ϭ 0 H1 BGRATIS Ͻ 0 ϭ 005

Eacutesta es una prueba de una cola y el valor prob en los resultados es para la alternativa de dos c BGRATIS 0 De manera que para esta prueba el valor prob es 02212 ϭ 0111 Ͼ ϭ 00que no se puede rechazar H0 las ventas no disminuyen significativamente cuando aumenta ro de pasajeros que vuelan gratis

c) H0 BPROMOC ϭ 28 H1 BPROMOC 28 ϭ 010

87247ᎏᎏ

151217SCRk ᎏᎏ

SCE(n Ϫ k Ϫ 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3156

El valor observado t de los resultados de regresioacuten es

ϭ ϭ Ϫ0420

Con 11 grados de libertad y ϭ 010 en ambas colas combinadas los valores criacuteticos t parba son Ϯ1796 asiacute el valor observado estaacute dentro de la regioacuten de aceptacioacuten No se rechacambio en VENTAS para un incremento de una unidad ($1000) en PROMOC no es significate diferente de 28 ($28000)

d) Con 11 grados de libertad el valor t para un intervalo del 90 de confianza es 1796 por lo

tervalo esbCOMP Ϯ 1796sbCOMP

ϭ Ϫ13238 Ϯ 1796(3686)

ϭ Ϫ13238 Ϯ 6620 ϭ (Ϫ19858 Ϫ 6618)

La liacutenea aeacuterea puede tener una seguridad del 90 de que el ingreso por los boletos en una ofminuye entre $6600 y $19900 aproximadamente con cada liacutenea aeacuterea adicional que comp

135 Teacutecnicas de modelado

Dada una variable que deseamos explicar y un conjunto de variables explicativas potencialehaya varias ecuaciones de regresioacuten diferentes que podamos estudiar dependiendo de queacute explicativas incluyamos y de coacutemo lo hagamos Cada una de esas ecuaciones de regresioacutence como modelo Las teacutecnicas de modelado son las distintas formas en que podemos incluriables explicativas y verificar queacute tan apropiados son los modelos de regresioacuten Existen municas de modelado diferentes pero soacutelo veremos dos de las maacutes utilizadas

Datos cualitativos y variables ficticias

En todos los ejemplos de regresioacuten que hemos visto hasta ahora los datos manejados hanmeacutericos o cuantitativos Pero ocasionalmente nos enfrentaremos con una variable categoacuterilitativa En el problema del inicio el capiacutetulo el director de personal desea ver si el salarioun vendedor depende de su sexo En la tabla 13-5 repetimos los datos de dicho problema

Por el momento ignore la antiguumledad y utilice la teacutecnica desarrollada en el capiacutetulo 9 bar la diferencia entre las medias de dos poblaciones para ver si los hombres ganan maacutes qu

jeres Pruebe con ϭ 001 Si tomamos a los hombres como la poblacioacuten 1 y a las mujerespoblacioacuten 2 probaremos las siguientes hipoacutetesis

H0 1 ϭ 2 larr Hipoacutetesis nula no existe discriminacioacuten por sexo en los salarios base

H1 1 Ͼ 2 larr Hipoacutetesis alternativa se discrimina a las mujeres en su salario base

ϭ 001 larr Nivel de significancia

Revisioacuten del enfoqueanterior del problema

Buacutesqueda dediferentes modelos

25950 Ϫ 28ᎏᎏ

4877

(bPROMOC Ϫ 28)ᎏᎏ

sbPROMOC

Datos para el problemade discriminacioacuten porsexo

Tabla 13-5 Vendedores VendedorasAntiguumledad Salario base Antiguumledad Salario base(en meses) (en miles) (en meses) (en miles)

6 75 5 62

10 86 13 87

12 91 15 94

18 103 21 98

30 130

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3256

A continuacioacuten bosquejamos el anaacutelisis Si tiene problemas para seguirlo deberaacute repasamente la seccioacuten 93

n1 ϭ 5 n2 ϭ 4

x ෆ1 ϭ 97 x ෆ2 ϭ 8525

s2

1 ϭ 4415 s2

2 ϭ 2609

s2

p ϭ

ϭ

ϭ 3641

x ෆ1Ϫ x

ෆ2ϭ s pΊ ϩ

ϭ 128

t ϭ

ϭ

ϭ 092

Con siete grados de libertad el valor t criacutetico para una prueba de cola superior con ϭ 001 eComo el valor t observado de 092 es menor que 2998 no podemos rechazar H0

Entonces el anaacutelisis concluye que no parece haber discriminacioacuten por sexo en los salarPero recuerde que hasta ahora se han ignorado los datos de antiguumledad laboral para el anaacuteli

Antes de seguir vea el diagrama de dispersioacuten de los datos En la figura 13-9 los punto

corresponden a los hombres y los blancos a las mujeres El diagrama de dispersioacuten muestraridad que el salario base aumenta con los antildeos de antiguumledad pero si con la mirada sigue lo qla recta de regresioacuten notaraacute que los puntos negros tienden a estar arriba de ella y los blancos

La figura 13-10 da la salida de una regresioacuten del salario base sobre los meses de antiguumlelos resultados se ve que la antiguumledad es una variable explicativa altamente significativa

Ademaacutes r 2

ϭ 926 que indica que la variable meses de antiguumledad explica cerca del 9variacioacuten en el salario base La figura 13-11 contiene parte de la salida que no se vio antesbla de residuos Para cada punto el residuo es simplemente Y Ϫ Y ˆ que se reconoce como el

Una ldquomiradardquo a los

datos

El enfoque anterior nodetecta discriminacioacuten

(97 ndash 8525) ndash 0ᎏᎏ

128

( x ෆ1 ndash x ෆ2) ndash (1 Ϫ 2)H0

ᎏᎏᎏ

ˆ x ෆ1Ϫ

x ෆ2

1ᎏ

n2

1ᎏ

n1

4(4415) ϩ 3(2609)ᎏᎏᎏ5 ϩ 4 ndash 2

(n1 ndash 1)s21 ϩ (n2 ndash 1)s22ᎏᎏᎏ

n1 ϩ n2 ndash 2

FIGURA 13-9

Diagrama de dis-persioacuten de salariosbase contra mesesde antiguumledad

4 8 12 16 20 24 28

4

8

12

Meses de antiguumledad

S a l a r i o ( m i l e s d e d oacute l a r e s )

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3356

el ajuste de la recta de regresioacuten en ese punto En la figura 13-11 AJUST1 son los valores y RESI1 son los residuos

Tal vez la parte maacutes importante del anaacutelisis del resultado de una regresioacuten sea estusiduos Si la regresioacuten incluye todos los factores explicativos relevantes estos residuo

ser aleatorios Dicho de otro modo si los residuos muestran cualquier patroacuten no aleat

to indica que hay algo sistemaacutetico que afecta el proceso y que no hemos tomado en cu

manera que buscamos patrones en los residuos o para decirlo de forma maacutes pintoresca ldquopmos a los residuos hasta hacerlos hablarrdquo

Si observamos los residuos presentados en la figura 13-11 vemos que los primeros cincoson positivos De modo que para los vendedores tenemos Y ndash Y ˆ Ͼ 0 o Y Ͼ Y ˆ es decir laregresioacuten cae abajo de estos cinco puntos Tres de los cuatro uacuteltimos residuos son negaticonsiguiente para las vendedoras tenemos Y Ϫ Y ˆ Ͻ 0 o Y Ͻ Y ˆ asiacute que la recta de regresicuentra arriba de tres de los cuatro puntos Esto confirma lo que vimos al observar el diagdispersioacuten de la figura 13-9 Este patroacuten no aleatorio en los residuos sugiere que el sexo siacute etor determinante del salario base

iquestCoacutemo podemos incorporar el sexo de los vendedores dentro del modelo de regresioacutencemos utilizando un dispositivo llamado variable ficticia (o variable indicadora) Para lpuntos que representan a los vendedores esta variable tiene valor de 0 y para los cuatro purepresentan a las vendedoras valdraacute 1 Los datos de entrada para nuestra regresioacuten con variticias se dan en la tabla 13-6

Para los datos de la tabla 13-6 se ajusta una regresioacuten de la forma

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

Uso de variablesficticias

Deteccioacuten depatrones en losresiduos

ldquoPresionar a losresiduosrdquo

Anaacutel i s i s de r e gr e s i oacuten

La ec uac i oacuten de r e gr es i oacuten esSALARI O ϭ 5 81 ϩ 0 233 MESES

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t pCons t a nt e 5 8093 0 4038 14 39 0 000MESES 0 23320 0 02492 9 36 0 000

s ϭ 0 5494 R- s q ϭ 92 6

Anaacute l i s i s de va r i a nz aFUENTE GL SC MC F Re gr e s i oacuten 1 26 443 24 443 87 61 0Er r or 7 2 113 0 302Tot a l 8 28 556

FIGURA 13-10

Regresioacuten conMinitab del salariobase sobre losmeses deantiguumledad

RENGLOacuteN SALARI O AJ UST1 RESI 1

1 7 5 7 2085 0 2914992 8 6 8 1413 0 458684

3 9 1 8 6077 0 4922764 10 3 10 0069 0 2930545 13 0 12 8054 0 1946076 6 2 6 9753 - 0 7752977 8 7 8 8409 - 0 1409288 9 4 9 3073 0 0926649 9 8 10 7066 - 0 906558

FIGURA 13-11

Tabla de residuosde Minitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2756

gar el nuacutemero de anuncios como segunda variable explicativa ademaacutes del costo de los anuncios eplica nada maacutes alrededor del 1 adicional de la variacioacuten de las ventas totales

En este punto es justo preguntarse iquestqueacute variable realmente explica la variacioacuten de las ventotales en la regresioacuten muacuteltiple La respuesta es que ambas la explican pero no podemos separ

sus contribuciones individuales debido a que estaacuten altamente correlacionadas entre siacute E

consecuencia sus coeficientes en la regresioacuten muacuteltiple tienen errores estaacutendar altos valore

calculados relativamente bajos y valores prob Ͼ | t | relativamente altos

iquestDe queacute manera nos afecta esta multicolinealidad Todaviacutea podemos hacer predicciones relativmente precisas cuando se encuentra presente note que para la regresioacuten muacuteltiple (la salida se dala figura 13-8) el error estaacutendar de la estimacioacuten que determina el ancho de los intervalos de co

fianza para las predicciones es 3989 mientras que para la regresioacuten simple con el costo de los anucios como variable explicativa (salida en la figura 13-7) tenemos se ϭ 3849 Lo que no podemhacer es predecir con mucha precisioacuten coacutemo cambiaraacuten las ventas si aumentamos en uno el nuacutemede anuncios La regresioacuten muacuteltiple dice que b1 ϭ 0625 (esto es cada anuncio aumenta las ventotales de pizzas alrededor de $625) pero el error estaacutendar de este coeficiente es 112 (es decir apximadamente $1120)

Las contribucionesindividuales nopueden separarse

Ejercicios 134

Ejercicios de autoevaluacioacuten

EA 13-4 Edith Pratt es una ocupada ejecutiva de una compantildeiacutea de transporte de carga a nivel nacional y va tara una junta porque no encuentra la salida de la regresioacuten muacuteltiple elaborada por un asistente Si la regsioacuten total es significativa al nivel 005 ella desea usar las salida de computadora como evidencia para fudamentar algunas ideas que expondraacute en la reunioacuten Sin embargo su ayudante estaacute enfermo De hectoda la informacioacuten que tiene de la regresioacuten muacuteltiple es un trozo de papel con los siguientes datos

Regresioacuten paraEdith Pratt

SCR 8724 con gl

SCE con 17 gl

SCT 10236 con 24 gl

Como el papel ni siquiera tiene todos los nuacutemeros Edith ha concluido que no es uacutetil Usted sin embardebe saber maacutes que ella iquestPuede Edith entrar en la junta o debe seguir buscando la salida de computador

EA 13-5 Una pequentildea liacutenea aeacuterea de Nueva Inglaterra realizoacute una encuesta sobre sus 15 terminales y obtuvo losguientes datos para el mes de febrero donde

VENTAS ϭ ingreso total seguacuten el nuacutemero de boletos vendidos (en miles de doacutelares)

PROMOCϭ cantidad gastada en promociones de la liacutenea aeacuterea en el aacuterea (en miles de doacutelares)

COMPET ϭ nuacutemero de liacuteneas aeacutereas que compiten en esa terminal

GRATIS ϭ nuacutemero de pasajeros que vuelan gratis (por diferentes razones)

Sugerencia el concepto de hacer infe-rencias respecto a una regresioacuten muacutelti-ple es justo lo mismo que se hizo en elcapiacutetulo 12 cuando hicimos inferencias

respecto a una recta de regresioacuten excepto que ahora se em-

plean dos o maacutes variables independientes Advertencia lamulticolinealidad es un problema que debe manejarse enla regresioacuten muacuteltiple y es necesario desarrollar una com-prensioacuten con sentido comuacuten Recuerde que todaviacutea puedehacer predicciones precisas cuando estaacute presente Pero re-cuerde tambieacuten que no puede decir con mucha precisioacuten

cuaacutento cambiaraacute la variable dependiente si ldquomanipulardquo lavariables independientes Entonces el objetivo debe seminimizar la multicolinealidad Sugerencia la mejor regresioacuten muacuteltiple es la que explica la relacioacuten entre los datos asentildealar la responsabilidad de la mayor proporcioacuten de la va

riacioacuten en la variable dependiente con el menor nuacutemero dvariables independientes Advertencia no es una buenidea incluir demasiadas variables independientes soacutelo porque cuenta con una computadora y un paquete de softwarpara estadiacutestica

SUGERENCIAS

Y

SUPOSICIONES

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2856

Ventas (doacutelares) Promoc (doacutelares) Compet Gratis

793 25 10 3

2001 55 8 6

1632 60 12 9

2001 79 7 16

1460 52 8 15

1777 76 12 9

309 20 12 8

2919 90 5 10

1600 40 8 43394 96 5 16

1596 55 11 7

863 30 12 6

2375 60 6 10

1072 50 10 4

1550 35 10 4

a) Utilice la siguiente salida de Minitab para determinar la ecuacioacuten de regresioacuten que mejor se ara la liacutenea aeacuterea

La ec uaci oacuten de r egr es i oacuten esVENTAS ϭ 172 ϩ 25 9 PROMOVϪ 13 2 COMPET Ϫ 3 04 GRATI S

Pr onos t i cador Coef Des vEs t Coci ent e - t Cons t ant e 172 34 51 38 3 35 0PROMOV 25 950 4 877 5 32 0COMPET - 13 238 3 686 - 3 59 0GRATI S - 3 041 2 342 - 1 30 0

b) iquestLos pasajeros que vuelan gratis ocasionan una disminucioacuten significativa en las ventas Fpruebe las hipoacutetesis apropiadas Use ϭ 005

c) iquestUn incremento de $1000 en las promociones cambia las ventas en $28000 o el cambio ecativamente diferente de $28000 Formule y pruebe las hipoacutetesis adecuadas Use ϭ 010

d) Calcule un intervalo de confianza del 90 para el coeficiente de la pendiente de la COMPET

Aplicaciones

13-22 Mark Lowtown publica el perioacutedico Mosquito Junction Enquirer y tiene problemas para predectidad de papel perioacutedico que necesita imprimir diariamente Eligioacute aleatoriamente 27 diacuteas del arior y registroacute la siguiente informacioacuten

PESO ϭ peso en libras de papel perioacutedico para la edicioacuten de ese diacutea

CLASIFICADOS ϭ nuacutemero de anuncios clasificados

PUBLICIDAD ϭ nuacutemero de anuncios publicitarios

PLANA COMPLETA ϭ nuacutemero de anuncios a una plana

Utilizando Minitab para hacer una regresioacuten de PESO sobre las otras tres variables Mark obtuguiente salida

Pr onos t i cador Coef Des vEs t Coci ent e- t Cons t ant e 1072 95 872 43 1 23 0CLASI FI CADOS 0 251 0 126 1 99 0PUBLI CI DAD 1 250 0 884 1 41 0PLANA COMPLETA 250 66 67 92 3 69 0

a) Mark siempre ha pensado que cada anuncio publicitario utiliza al menos 3 libras de papel iquestsioacuten le da una razoacuten significativa para dudar esto al nivel del 5

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2956

b) De manera similar Mark siempre ha creiacutedo que cada anuncio clasificado utiliza aproximmedia libra de papel iquestTiene ahora Mark una razoacuten significativa para dudar esto al nivel del

c) Mark vende espacios de anuncios de plana completa a los comerciantes locales a $30 la paacutegberaacute pensar en ajustar sus tarifas si el papel perioacutedico le cuesta $009 por libra Suponga costos son despreciables Establezca expliacutecitamente las hipoacutetesis y una conclusioacuten (Sugere

jando todo lo demaacutes constante cada anuncio adicional de plana completa tiene un costo de bras de papel ϫ $009 por libra ϭ $2256 El punto de equilibrio es 333333 libras iquestPor quel coeficiente de pendiente para PLANA COMPLETA es significativamente mayor que Mark no estaacute obteniendo ganancias y debe cambiar sus tarifas)

13-23 Para los datos del ejercicio 13-18 y un nivel de significancia de 010 iquestcuaacuteles variables son sign

mente explicativas de los resultados de los exaacutemenes (Habiacutea 12 estudiantes en la muestra) 13-24 Para los datos del ejercicio 13-18 y la siguiente salida de Minitab del procedimiento de regresiple hecho por Bill

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 3134 42 783 60Er r or 7 951 25 135 89Tot a l 11 4085 67

a) iquestCuaacutel es el valor observado de F b) A un nivel de significancia de 005 iquestcuaacutel es el valor criacutetico de F que se debe utilizar para d

si la regresioacuten como un todo es significativac) Basaacutendose en las respuestas a los incisos a) y b) iquestes la regresioacuten significativa como un tod

13-25 Remiacutetase al ejercicio 13-19 A un nivel de significancia de 001 iquestes la variable DISTANCIA uble explicativa significativa para VENTAS

13-26 Para los datos del ejercicio 13-19 y la siguiente salida adicional de Minitab al correr la regresioacuten

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 2861495 715374 102 39 0Er r or 18 125761 6896 7Tot a l 22 2987256

Al nivel de significancia de 005 iquestes la regresioacuten significativa como un todo

13-27 Henry Lander es el director de produccioacuten de la Alecos Corporation de Caracas Venezuela Hede que le ayude a determinar una foacutermula para predecir el ausentismo de los empacadores de chipoacutetesis es que la temperatura diaria promedio puede explicar el porcentaje de ausentismo Durios meses reuacutene datos ejecuta el procedimiento de regresioacuten simple y encuentra que la tempeplica 66 de la variacioacuten en el ausentismo Pero Henry no estaacute convencido de que eacuteste sea un cador satisfactorio Sugiere que la precipitacioacuten pluvial diaria podriacutea tambieacuten tener algo que vausentismo de modo que registra los datos correspondientes y hace una regresioacuten del ausentismte el tiempo de lluvias y obtiene un valor R2 de 059 ldquoiexclEurekardquo grita usted ldquoiexclLo tengo Con uticador que explica 66 y otro que explica 59 todo lo que tengo que hacer es una regresioacutenutilizando ambos y seguramente tendreacute un pronosticador casi perfectordquo Para su desaacutenimo sin la regresioacuten muacuteltiple tiene una R

2 de soacutelo 68 que es solamente un poco mejor que la variablperatura sola iquestCoacutemo puede explicar esta aparente discrepancia

13-28 Juan Armenlegg administrador de Rockyrsquos Diamond y Jewelry Store estaacute interesado en desamodelo para estimar la demanda del consumidor para su costosa mercanciacutea Como la mayoriacutea de

tes compran diamantes y joyas a creacutedito Juan estaacute seguro de que dos factores que deben influirmanda de los clientes son la tasa real de inflacioacuten anual y la tasa real de intereses sobre preacutestamprincipales bancos del paiacutes Explique algunos problemas que Juan podriacutea encontrar si fuera a dun modelo de regresioacuten basado en estas dos variables de prediccioacuten

13-29 Un nuevo programa de juegos Check That Model pide a los concursantes que especifiquen el nuacutenimo de paraacutemetros que necesitan para determinar si un modelo de regresioacuten muacuteltiple es signifimo un todo para ϭ 001 Usted ganoacute la apuesta con 4 paraacutemetros Use la siguiente informacioacutenterminar si la regresioacuten es significativa

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3056

R 2

ϭ 07452

SCE ϭ 1254

n ϭ 18

Nuacutemero de variables independientes ϭ 3

13-30 La Scottish Turist Agency estaacute interesada en el nuacutemero de turistas que entran al paiacutes cada semanrante la temporada alta Se recolectaron los siguientes datos

Turistas (Y ) ϭ nuacutemero de turistas que entran a Escocia en una semana (en miles)

Cambio (X 1)ϭ nuacutemero de libras escocesas compradas por $1 doacutelar

Precio (X 2) ϭ nuacutemero de libras escocesas cobradas por viaje redondo en camioacuten de Londres a Edimburgo

Promoc (X 3) ϭ cantidad gastada en promocioacuten del paiacutes (en miles de libras escocesas)Temp (X 4) ϭ temperatura media durante la semana en Edimburgo (en grados Celsius)

Turistas (Y ) Cambio (X 1) Precio (X 2) Promoc (X 3) Temp (X 4)

69 061 40 87 154

71 059 40 88 156

68 063 40 85 154

79 061 35 86 153

76 060 35 94 158

82 065 35 99 162

80 058 35 98 164

84 059 35 102 166

97 061 30 114 174

98 062 30 116 172

72 057 40 84 176

67 055 40 86 164

a) Utilice el paquete de software que tenga para determinar la ecuacioacuten de regresioacuten que mejote a los datos de la agencia de turismo

b) iquestEs la tasa de cambio una variable explicativa significativa Establezca y pruebe las hipoacutetesidas a un nivel de significancia de 010

c) Un incremento de 1000 libras en las promociones iquestaumenta el nuacutemero de turistas en maacutesEstablezca y pruebe las hipoacutetesis adecuadas para un nivel de significancia de 005

d) Calcule un intervalo de confianza del 95 para el coeficiente de la pendiente de Temp

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-4 Como SCT ϭ SCR ϩ SCE SCE ϭ SCT Ϫ SCR ϭ 10236 Ϫ 8724 ϭ 1512Como gl SCT ϭ gl SCR ϩ gl SCE gl SCR ϭ gl SCT Ϫ gl SCE ϭ 24 Ϫ 17 ϭ 7

Entonces F ϭ ϭ ϭ 1401

F CRiacuteT ϭ F (7 17 005) ϭ 261Como F OBS gt F CRIacuteT se concluye que la regresioacuten es significativa como un todo Edith debe conticando la salida de computadora de la regresioacuten para usarla en la junta

EA 13-5 De la salida de computadora se obti enen los siguientes resultadosa) VENTAS ϭ 17234 ϩ 25950PROMOC Ϫ13238COMPET Ϫ 3041GRATISb) H0 BGRATIS ϭ 0 H1 BGRATIS Ͻ 0 ϭ 005

Eacutesta es una prueba de una cola y el valor prob en los resultados es para la alternativa de dos c BGRATIS 0 De manera que para esta prueba el valor prob es 02212 ϭ 0111 Ͼ ϭ 00que no se puede rechazar H0 las ventas no disminuyen significativamente cuando aumenta ro de pasajeros que vuelan gratis

c) H0 BPROMOC ϭ 28 H1 BPROMOC 28 ϭ 010

87247ᎏᎏ

151217SCRk ᎏᎏ

SCE(n Ϫ k Ϫ 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3156

El valor observado t de los resultados de regresioacuten es

ϭ ϭ Ϫ0420

Con 11 grados de libertad y ϭ 010 en ambas colas combinadas los valores criacuteticos t parba son Ϯ1796 asiacute el valor observado estaacute dentro de la regioacuten de aceptacioacuten No se rechacambio en VENTAS para un incremento de una unidad ($1000) en PROMOC no es significate diferente de 28 ($28000)

d) Con 11 grados de libertad el valor t para un intervalo del 90 de confianza es 1796 por lo

tervalo esbCOMP Ϯ 1796sbCOMP

ϭ Ϫ13238 Ϯ 1796(3686)

ϭ Ϫ13238 Ϯ 6620 ϭ (Ϫ19858 Ϫ 6618)

La liacutenea aeacuterea puede tener una seguridad del 90 de que el ingreso por los boletos en una ofminuye entre $6600 y $19900 aproximadamente con cada liacutenea aeacuterea adicional que comp

135 Teacutecnicas de modelado

Dada una variable que deseamos explicar y un conjunto de variables explicativas potencialehaya varias ecuaciones de regresioacuten diferentes que podamos estudiar dependiendo de queacute explicativas incluyamos y de coacutemo lo hagamos Cada una de esas ecuaciones de regresioacutence como modelo Las teacutecnicas de modelado son las distintas formas en que podemos incluriables explicativas y verificar queacute tan apropiados son los modelos de regresioacuten Existen municas de modelado diferentes pero soacutelo veremos dos de las maacutes utilizadas

Datos cualitativos y variables ficticias

En todos los ejemplos de regresioacuten que hemos visto hasta ahora los datos manejados hanmeacutericos o cuantitativos Pero ocasionalmente nos enfrentaremos con una variable categoacuterilitativa En el problema del inicio el capiacutetulo el director de personal desea ver si el salarioun vendedor depende de su sexo En la tabla 13-5 repetimos los datos de dicho problema

Por el momento ignore la antiguumledad y utilice la teacutecnica desarrollada en el capiacutetulo 9 bar la diferencia entre las medias de dos poblaciones para ver si los hombres ganan maacutes qu

jeres Pruebe con ϭ 001 Si tomamos a los hombres como la poblacioacuten 1 y a las mujerespoblacioacuten 2 probaremos las siguientes hipoacutetesis

H0 1 ϭ 2 larr Hipoacutetesis nula no existe discriminacioacuten por sexo en los salarios base

H1 1 Ͼ 2 larr Hipoacutetesis alternativa se discrimina a las mujeres en su salario base

ϭ 001 larr Nivel de significancia

Revisioacuten del enfoqueanterior del problema

Buacutesqueda dediferentes modelos

25950 Ϫ 28ᎏᎏ

4877

(bPROMOC Ϫ 28)ᎏᎏ

sbPROMOC

Datos para el problemade discriminacioacuten porsexo

Tabla 13-5 Vendedores VendedorasAntiguumledad Salario base Antiguumledad Salario base(en meses) (en miles) (en meses) (en miles)

6 75 5 62

10 86 13 87

12 91 15 94

18 103 21 98

30 130

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3256

A continuacioacuten bosquejamos el anaacutelisis Si tiene problemas para seguirlo deberaacute repasamente la seccioacuten 93

n1 ϭ 5 n2 ϭ 4

x ෆ1 ϭ 97 x ෆ2 ϭ 8525

s2

1 ϭ 4415 s2

2 ϭ 2609

s2

p ϭ

ϭ

ϭ 3641

x ෆ1Ϫ x

ෆ2ϭ s pΊ ϩ

ϭ 128

t ϭ

ϭ

ϭ 092

Con siete grados de libertad el valor t criacutetico para una prueba de cola superior con ϭ 001 eComo el valor t observado de 092 es menor que 2998 no podemos rechazar H0

Entonces el anaacutelisis concluye que no parece haber discriminacioacuten por sexo en los salarPero recuerde que hasta ahora se han ignorado los datos de antiguumledad laboral para el anaacuteli

Antes de seguir vea el diagrama de dispersioacuten de los datos En la figura 13-9 los punto

corresponden a los hombres y los blancos a las mujeres El diagrama de dispersioacuten muestraridad que el salario base aumenta con los antildeos de antiguumledad pero si con la mirada sigue lo qla recta de regresioacuten notaraacute que los puntos negros tienden a estar arriba de ella y los blancos

La figura 13-10 da la salida de una regresioacuten del salario base sobre los meses de antiguumlelos resultados se ve que la antiguumledad es una variable explicativa altamente significativa

Ademaacutes r 2

ϭ 926 que indica que la variable meses de antiguumledad explica cerca del 9variacioacuten en el salario base La figura 13-11 contiene parte de la salida que no se vio antesbla de residuos Para cada punto el residuo es simplemente Y Ϫ Y ˆ que se reconoce como el

Una ldquomiradardquo a los

datos

El enfoque anterior nodetecta discriminacioacuten

(97 ndash 8525) ndash 0ᎏᎏ

128

( x ෆ1 ndash x ෆ2) ndash (1 Ϫ 2)H0

ᎏᎏᎏ

ˆ x ෆ1Ϫ

x ෆ2

1ᎏ

n2

1ᎏ

n1

4(4415) ϩ 3(2609)ᎏᎏᎏ5 ϩ 4 ndash 2

(n1 ndash 1)s21 ϩ (n2 ndash 1)s22ᎏᎏᎏ

n1 ϩ n2 ndash 2

FIGURA 13-9

Diagrama de dis-persioacuten de salariosbase contra mesesde antiguumledad

4 8 12 16 20 24 28

4

8

12

Meses de antiguumledad

S a l a r i o ( m i l e s d e d oacute l a r e s )

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3356

el ajuste de la recta de regresioacuten en ese punto En la figura 13-11 AJUST1 son los valores y RESI1 son los residuos

Tal vez la parte maacutes importante del anaacutelisis del resultado de una regresioacuten sea estusiduos Si la regresioacuten incluye todos los factores explicativos relevantes estos residuo

ser aleatorios Dicho de otro modo si los residuos muestran cualquier patroacuten no aleat

to indica que hay algo sistemaacutetico que afecta el proceso y que no hemos tomado en cu

manera que buscamos patrones en los residuos o para decirlo de forma maacutes pintoresca ldquopmos a los residuos hasta hacerlos hablarrdquo

Si observamos los residuos presentados en la figura 13-11 vemos que los primeros cincoson positivos De modo que para los vendedores tenemos Y ndash Y ˆ Ͼ 0 o Y Ͼ Y ˆ es decir laregresioacuten cae abajo de estos cinco puntos Tres de los cuatro uacuteltimos residuos son negaticonsiguiente para las vendedoras tenemos Y Ϫ Y ˆ Ͻ 0 o Y Ͻ Y ˆ asiacute que la recta de regresicuentra arriba de tres de los cuatro puntos Esto confirma lo que vimos al observar el diagdispersioacuten de la figura 13-9 Este patroacuten no aleatorio en los residuos sugiere que el sexo siacute etor determinante del salario base

iquestCoacutemo podemos incorporar el sexo de los vendedores dentro del modelo de regresioacutencemos utilizando un dispositivo llamado variable ficticia (o variable indicadora) Para lpuntos que representan a los vendedores esta variable tiene valor de 0 y para los cuatro purepresentan a las vendedoras valdraacute 1 Los datos de entrada para nuestra regresioacuten con variticias se dan en la tabla 13-6

Para los datos de la tabla 13-6 se ajusta una regresioacuten de la forma

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

Uso de variablesficticias

Deteccioacuten depatrones en losresiduos

ldquoPresionar a losresiduosrdquo

Anaacutel i s i s de r e gr e s i oacuten

La ec uac i oacuten de r e gr es i oacuten esSALARI O ϭ 5 81 ϩ 0 233 MESES

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t pCons t a nt e 5 8093 0 4038 14 39 0 000MESES 0 23320 0 02492 9 36 0 000

s ϭ 0 5494 R- s q ϭ 92 6

Anaacute l i s i s de va r i a nz aFUENTE GL SC MC F Re gr e s i oacuten 1 26 443 24 443 87 61 0Er r or 7 2 113 0 302Tot a l 8 28 556

FIGURA 13-10

Regresioacuten conMinitab del salariobase sobre losmeses deantiguumledad

RENGLOacuteN SALARI O AJ UST1 RESI 1

1 7 5 7 2085 0 2914992 8 6 8 1413 0 458684

3 9 1 8 6077 0 4922764 10 3 10 0069 0 2930545 13 0 12 8054 0 1946076 6 2 6 9753 - 0 7752977 8 7 8 8409 - 0 1409288 9 4 9 3073 0 0926649 9 8 10 7066 - 0 906558

FIGURA 13-11

Tabla de residuosde Minitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2856

Ventas (doacutelares) Promoc (doacutelares) Compet Gratis

793 25 10 3

2001 55 8 6

1632 60 12 9

2001 79 7 16

1460 52 8 15

1777 76 12 9

309 20 12 8

2919 90 5 10

1600 40 8 43394 96 5 16

1596 55 11 7

863 30 12 6

2375 60 6 10

1072 50 10 4

1550 35 10 4

a) Utilice la siguiente salida de Minitab para determinar la ecuacioacuten de regresioacuten que mejor se ara la liacutenea aeacuterea

La ec uaci oacuten de r egr es i oacuten esVENTAS ϭ 172 ϩ 25 9 PROMOVϪ 13 2 COMPET Ϫ 3 04 GRATI S

Pr onos t i cador Coef Des vEs t Coci ent e - t Cons t ant e 172 34 51 38 3 35 0PROMOV 25 950 4 877 5 32 0COMPET - 13 238 3 686 - 3 59 0GRATI S - 3 041 2 342 - 1 30 0

b) iquestLos pasajeros que vuelan gratis ocasionan una disminucioacuten significativa en las ventas Fpruebe las hipoacutetesis apropiadas Use ϭ 005

c) iquestUn incremento de $1000 en las promociones cambia las ventas en $28000 o el cambio ecativamente diferente de $28000 Formule y pruebe las hipoacutetesis adecuadas Use ϭ 010

d) Calcule un intervalo de confianza del 90 para el coeficiente de la pendiente de la COMPET

Aplicaciones

13-22 Mark Lowtown publica el perioacutedico Mosquito Junction Enquirer y tiene problemas para predectidad de papel perioacutedico que necesita imprimir diariamente Eligioacute aleatoriamente 27 diacuteas del arior y registroacute la siguiente informacioacuten

PESO ϭ peso en libras de papel perioacutedico para la edicioacuten de ese diacutea

CLASIFICADOS ϭ nuacutemero de anuncios clasificados

PUBLICIDAD ϭ nuacutemero de anuncios publicitarios

PLANA COMPLETA ϭ nuacutemero de anuncios a una plana

Utilizando Minitab para hacer una regresioacuten de PESO sobre las otras tres variables Mark obtuguiente salida

Pr onos t i cador Coef Des vEs t Coci ent e- t Cons t ant e 1072 95 872 43 1 23 0CLASI FI CADOS 0 251 0 126 1 99 0PUBLI CI DAD 1 250 0 884 1 41 0PLANA COMPLETA 250 66 67 92 3 69 0

a) Mark siempre ha pensado que cada anuncio publicitario utiliza al menos 3 libras de papel iquestsioacuten le da una razoacuten significativa para dudar esto al nivel del 5

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2956

b) De manera similar Mark siempre ha creiacutedo que cada anuncio clasificado utiliza aproximmedia libra de papel iquestTiene ahora Mark una razoacuten significativa para dudar esto al nivel del

c) Mark vende espacios de anuncios de plana completa a los comerciantes locales a $30 la paacutegberaacute pensar en ajustar sus tarifas si el papel perioacutedico le cuesta $009 por libra Suponga costos son despreciables Establezca expliacutecitamente las hipoacutetesis y una conclusioacuten (Sugere

jando todo lo demaacutes constante cada anuncio adicional de plana completa tiene un costo de bras de papel ϫ $009 por libra ϭ $2256 El punto de equilibrio es 333333 libras iquestPor quel coeficiente de pendiente para PLANA COMPLETA es significativamente mayor que Mark no estaacute obteniendo ganancias y debe cambiar sus tarifas)

13-23 Para los datos del ejercicio 13-18 y un nivel de significancia de 010 iquestcuaacuteles variables son sign

mente explicativas de los resultados de los exaacutemenes (Habiacutea 12 estudiantes en la muestra) 13-24 Para los datos del ejercicio 13-18 y la siguiente salida de Minitab del procedimiento de regresiple hecho por Bill

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 3134 42 783 60Er r or 7 951 25 135 89Tot a l 11 4085 67

a) iquestCuaacutel es el valor observado de F b) A un nivel de significancia de 005 iquestcuaacutel es el valor criacutetico de F que se debe utilizar para d

si la regresioacuten como un todo es significativac) Basaacutendose en las respuestas a los incisos a) y b) iquestes la regresioacuten significativa como un tod

13-25 Remiacutetase al ejercicio 13-19 A un nivel de significancia de 001 iquestes la variable DISTANCIA uble explicativa significativa para VENTAS

13-26 Para los datos del ejercicio 13-19 y la siguiente salida adicional de Minitab al correr la regresioacuten

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 2861495 715374 102 39 0Er r or 18 125761 6896 7Tot a l 22 2987256

Al nivel de significancia de 005 iquestes la regresioacuten significativa como un todo

13-27 Henry Lander es el director de produccioacuten de la Alecos Corporation de Caracas Venezuela Hede que le ayude a determinar una foacutermula para predecir el ausentismo de los empacadores de chipoacutetesis es que la temperatura diaria promedio puede explicar el porcentaje de ausentismo Durios meses reuacutene datos ejecuta el procedimiento de regresioacuten simple y encuentra que la tempeplica 66 de la variacioacuten en el ausentismo Pero Henry no estaacute convencido de que eacuteste sea un cador satisfactorio Sugiere que la precipitacioacuten pluvial diaria podriacutea tambieacuten tener algo que vausentismo de modo que registra los datos correspondientes y hace una regresioacuten del ausentismte el tiempo de lluvias y obtiene un valor R2 de 059 ldquoiexclEurekardquo grita usted ldquoiexclLo tengo Con uticador que explica 66 y otro que explica 59 todo lo que tengo que hacer es una regresioacutenutilizando ambos y seguramente tendreacute un pronosticador casi perfectordquo Para su desaacutenimo sin la regresioacuten muacuteltiple tiene una R

2 de soacutelo 68 que es solamente un poco mejor que la variablperatura sola iquestCoacutemo puede explicar esta aparente discrepancia

13-28 Juan Armenlegg administrador de Rockyrsquos Diamond y Jewelry Store estaacute interesado en desamodelo para estimar la demanda del consumidor para su costosa mercanciacutea Como la mayoriacutea de

tes compran diamantes y joyas a creacutedito Juan estaacute seguro de que dos factores que deben influirmanda de los clientes son la tasa real de inflacioacuten anual y la tasa real de intereses sobre preacutestamprincipales bancos del paiacutes Explique algunos problemas que Juan podriacutea encontrar si fuera a dun modelo de regresioacuten basado en estas dos variables de prediccioacuten

13-29 Un nuevo programa de juegos Check That Model pide a los concursantes que especifiquen el nuacutenimo de paraacutemetros que necesitan para determinar si un modelo de regresioacuten muacuteltiple es signifimo un todo para ϭ 001 Usted ganoacute la apuesta con 4 paraacutemetros Use la siguiente informacioacutenterminar si la regresioacuten es significativa

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3056

R 2

ϭ 07452

SCE ϭ 1254

n ϭ 18

Nuacutemero de variables independientes ϭ 3

13-30 La Scottish Turist Agency estaacute interesada en el nuacutemero de turistas que entran al paiacutes cada semanrante la temporada alta Se recolectaron los siguientes datos

Turistas (Y ) ϭ nuacutemero de turistas que entran a Escocia en una semana (en miles)

Cambio (X 1)ϭ nuacutemero de libras escocesas compradas por $1 doacutelar

Precio (X 2) ϭ nuacutemero de libras escocesas cobradas por viaje redondo en camioacuten de Londres a Edimburgo

Promoc (X 3) ϭ cantidad gastada en promocioacuten del paiacutes (en miles de libras escocesas)Temp (X 4) ϭ temperatura media durante la semana en Edimburgo (en grados Celsius)

Turistas (Y ) Cambio (X 1) Precio (X 2) Promoc (X 3) Temp (X 4)

69 061 40 87 154

71 059 40 88 156

68 063 40 85 154

79 061 35 86 153

76 060 35 94 158

82 065 35 99 162

80 058 35 98 164

84 059 35 102 166

97 061 30 114 174

98 062 30 116 172

72 057 40 84 176

67 055 40 86 164

a) Utilice el paquete de software que tenga para determinar la ecuacioacuten de regresioacuten que mejote a los datos de la agencia de turismo

b) iquestEs la tasa de cambio una variable explicativa significativa Establezca y pruebe las hipoacutetesidas a un nivel de significancia de 010

c) Un incremento de 1000 libras en las promociones iquestaumenta el nuacutemero de turistas en maacutesEstablezca y pruebe las hipoacutetesis adecuadas para un nivel de significancia de 005

d) Calcule un intervalo de confianza del 95 para el coeficiente de la pendiente de Temp

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-4 Como SCT ϭ SCR ϩ SCE SCE ϭ SCT Ϫ SCR ϭ 10236 Ϫ 8724 ϭ 1512Como gl SCT ϭ gl SCR ϩ gl SCE gl SCR ϭ gl SCT Ϫ gl SCE ϭ 24 Ϫ 17 ϭ 7

Entonces F ϭ ϭ ϭ 1401

F CRiacuteT ϭ F (7 17 005) ϭ 261Como F OBS gt F CRIacuteT se concluye que la regresioacuten es significativa como un todo Edith debe conticando la salida de computadora de la regresioacuten para usarla en la junta

EA 13-5 De la salida de computadora se obti enen los siguientes resultadosa) VENTAS ϭ 17234 ϩ 25950PROMOC Ϫ13238COMPET Ϫ 3041GRATISb) H0 BGRATIS ϭ 0 H1 BGRATIS Ͻ 0 ϭ 005

Eacutesta es una prueba de una cola y el valor prob en los resultados es para la alternativa de dos c BGRATIS 0 De manera que para esta prueba el valor prob es 02212 ϭ 0111 Ͼ ϭ 00que no se puede rechazar H0 las ventas no disminuyen significativamente cuando aumenta ro de pasajeros que vuelan gratis

c) H0 BPROMOC ϭ 28 H1 BPROMOC 28 ϭ 010

87247ᎏᎏ

151217SCRk ᎏᎏ

SCE(n Ϫ k Ϫ 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3156

El valor observado t de los resultados de regresioacuten es

ϭ ϭ Ϫ0420

Con 11 grados de libertad y ϭ 010 en ambas colas combinadas los valores criacuteticos t parba son Ϯ1796 asiacute el valor observado estaacute dentro de la regioacuten de aceptacioacuten No se rechacambio en VENTAS para un incremento de una unidad ($1000) en PROMOC no es significate diferente de 28 ($28000)

d) Con 11 grados de libertad el valor t para un intervalo del 90 de confianza es 1796 por lo

tervalo esbCOMP Ϯ 1796sbCOMP

ϭ Ϫ13238 Ϯ 1796(3686)

ϭ Ϫ13238 Ϯ 6620 ϭ (Ϫ19858 Ϫ 6618)

La liacutenea aeacuterea puede tener una seguridad del 90 de que el ingreso por los boletos en una ofminuye entre $6600 y $19900 aproximadamente con cada liacutenea aeacuterea adicional que comp

135 Teacutecnicas de modelado

Dada una variable que deseamos explicar y un conjunto de variables explicativas potencialehaya varias ecuaciones de regresioacuten diferentes que podamos estudiar dependiendo de queacute explicativas incluyamos y de coacutemo lo hagamos Cada una de esas ecuaciones de regresioacutence como modelo Las teacutecnicas de modelado son las distintas formas en que podemos incluriables explicativas y verificar queacute tan apropiados son los modelos de regresioacuten Existen municas de modelado diferentes pero soacutelo veremos dos de las maacutes utilizadas

Datos cualitativos y variables ficticias

En todos los ejemplos de regresioacuten que hemos visto hasta ahora los datos manejados hanmeacutericos o cuantitativos Pero ocasionalmente nos enfrentaremos con una variable categoacuterilitativa En el problema del inicio el capiacutetulo el director de personal desea ver si el salarioun vendedor depende de su sexo En la tabla 13-5 repetimos los datos de dicho problema

Por el momento ignore la antiguumledad y utilice la teacutecnica desarrollada en el capiacutetulo 9 bar la diferencia entre las medias de dos poblaciones para ver si los hombres ganan maacutes qu

jeres Pruebe con ϭ 001 Si tomamos a los hombres como la poblacioacuten 1 y a las mujerespoblacioacuten 2 probaremos las siguientes hipoacutetesis

H0 1 ϭ 2 larr Hipoacutetesis nula no existe discriminacioacuten por sexo en los salarios base

H1 1 Ͼ 2 larr Hipoacutetesis alternativa se discrimina a las mujeres en su salario base

ϭ 001 larr Nivel de significancia

Revisioacuten del enfoqueanterior del problema

Buacutesqueda dediferentes modelos

25950 Ϫ 28ᎏᎏ

4877

(bPROMOC Ϫ 28)ᎏᎏ

sbPROMOC

Datos para el problemade discriminacioacuten porsexo

Tabla 13-5 Vendedores VendedorasAntiguumledad Salario base Antiguumledad Salario base(en meses) (en miles) (en meses) (en miles)

6 75 5 62

10 86 13 87

12 91 15 94

18 103 21 98

30 130

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3256

A continuacioacuten bosquejamos el anaacutelisis Si tiene problemas para seguirlo deberaacute repasamente la seccioacuten 93

n1 ϭ 5 n2 ϭ 4

x ෆ1 ϭ 97 x ෆ2 ϭ 8525

s2

1 ϭ 4415 s2

2 ϭ 2609

s2

p ϭ

ϭ

ϭ 3641

x ෆ1Ϫ x

ෆ2ϭ s pΊ ϩ

ϭ 128

t ϭ

ϭ

ϭ 092

Con siete grados de libertad el valor t criacutetico para una prueba de cola superior con ϭ 001 eComo el valor t observado de 092 es menor que 2998 no podemos rechazar H0

Entonces el anaacutelisis concluye que no parece haber discriminacioacuten por sexo en los salarPero recuerde que hasta ahora se han ignorado los datos de antiguumledad laboral para el anaacuteli

Antes de seguir vea el diagrama de dispersioacuten de los datos En la figura 13-9 los punto

corresponden a los hombres y los blancos a las mujeres El diagrama de dispersioacuten muestraridad que el salario base aumenta con los antildeos de antiguumledad pero si con la mirada sigue lo qla recta de regresioacuten notaraacute que los puntos negros tienden a estar arriba de ella y los blancos

La figura 13-10 da la salida de una regresioacuten del salario base sobre los meses de antiguumlelos resultados se ve que la antiguumledad es una variable explicativa altamente significativa

Ademaacutes r 2

ϭ 926 que indica que la variable meses de antiguumledad explica cerca del 9variacioacuten en el salario base La figura 13-11 contiene parte de la salida que no se vio antesbla de residuos Para cada punto el residuo es simplemente Y Ϫ Y ˆ que se reconoce como el

Una ldquomiradardquo a los

datos

El enfoque anterior nodetecta discriminacioacuten

(97 ndash 8525) ndash 0ᎏᎏ

128

( x ෆ1 ndash x ෆ2) ndash (1 Ϫ 2)H0

ᎏᎏᎏ

ˆ x ෆ1Ϫ

x ෆ2

1ᎏ

n2

1ᎏ

n1

4(4415) ϩ 3(2609)ᎏᎏᎏ5 ϩ 4 ndash 2

(n1 ndash 1)s21 ϩ (n2 ndash 1)s22ᎏᎏᎏ

n1 ϩ n2 ndash 2

FIGURA 13-9

Diagrama de dis-persioacuten de salariosbase contra mesesde antiguumledad

4 8 12 16 20 24 28

4

8

12

Meses de antiguumledad

S a l a r i o ( m i l e s d e d oacute l a r e s )

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3356

el ajuste de la recta de regresioacuten en ese punto En la figura 13-11 AJUST1 son los valores y RESI1 son los residuos

Tal vez la parte maacutes importante del anaacutelisis del resultado de una regresioacuten sea estusiduos Si la regresioacuten incluye todos los factores explicativos relevantes estos residuo

ser aleatorios Dicho de otro modo si los residuos muestran cualquier patroacuten no aleat

to indica que hay algo sistemaacutetico que afecta el proceso y que no hemos tomado en cu

manera que buscamos patrones en los residuos o para decirlo de forma maacutes pintoresca ldquopmos a los residuos hasta hacerlos hablarrdquo

Si observamos los residuos presentados en la figura 13-11 vemos que los primeros cincoson positivos De modo que para los vendedores tenemos Y ndash Y ˆ Ͼ 0 o Y Ͼ Y ˆ es decir laregresioacuten cae abajo de estos cinco puntos Tres de los cuatro uacuteltimos residuos son negaticonsiguiente para las vendedoras tenemos Y Ϫ Y ˆ Ͻ 0 o Y Ͻ Y ˆ asiacute que la recta de regresicuentra arriba de tres de los cuatro puntos Esto confirma lo que vimos al observar el diagdispersioacuten de la figura 13-9 Este patroacuten no aleatorio en los residuos sugiere que el sexo siacute etor determinante del salario base

iquestCoacutemo podemos incorporar el sexo de los vendedores dentro del modelo de regresioacutencemos utilizando un dispositivo llamado variable ficticia (o variable indicadora) Para lpuntos que representan a los vendedores esta variable tiene valor de 0 y para los cuatro purepresentan a las vendedoras valdraacute 1 Los datos de entrada para nuestra regresioacuten con variticias se dan en la tabla 13-6

Para los datos de la tabla 13-6 se ajusta una regresioacuten de la forma

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

Uso de variablesficticias

Deteccioacuten depatrones en losresiduos

ldquoPresionar a losresiduosrdquo

Anaacutel i s i s de r e gr e s i oacuten

La ec uac i oacuten de r e gr es i oacuten esSALARI O ϭ 5 81 ϩ 0 233 MESES

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t pCons t a nt e 5 8093 0 4038 14 39 0 000MESES 0 23320 0 02492 9 36 0 000

s ϭ 0 5494 R- s q ϭ 92 6

Anaacute l i s i s de va r i a nz aFUENTE GL SC MC F Re gr e s i oacuten 1 26 443 24 443 87 61 0Er r or 7 2 113 0 302Tot a l 8 28 556

FIGURA 13-10

Regresioacuten conMinitab del salariobase sobre losmeses deantiguumledad

RENGLOacuteN SALARI O AJ UST1 RESI 1

1 7 5 7 2085 0 2914992 8 6 8 1413 0 458684

3 9 1 8 6077 0 4922764 10 3 10 0069 0 2930545 13 0 12 8054 0 1946076 6 2 6 9753 - 0 7752977 8 7 8 8409 - 0 1409288 9 4 9 3073 0 0926649 9 8 10 7066 - 0 906558

FIGURA 13-11

Tabla de residuosde Minitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 2956

b) De manera similar Mark siempre ha creiacutedo que cada anuncio clasificado utiliza aproximmedia libra de papel iquestTiene ahora Mark una razoacuten significativa para dudar esto al nivel del

c) Mark vende espacios de anuncios de plana completa a los comerciantes locales a $30 la paacutegberaacute pensar en ajustar sus tarifas si el papel perioacutedico le cuesta $009 por libra Suponga costos son despreciables Establezca expliacutecitamente las hipoacutetesis y una conclusioacuten (Sugere

jando todo lo demaacutes constante cada anuncio adicional de plana completa tiene un costo de bras de papel ϫ $009 por libra ϭ $2256 El punto de equilibrio es 333333 libras iquestPor quel coeficiente de pendiente para PLANA COMPLETA es significativamente mayor que Mark no estaacute obteniendo ganancias y debe cambiar sus tarifas)

13-23 Para los datos del ejercicio 13-18 y un nivel de significancia de 010 iquestcuaacuteles variables son sign

mente explicativas de los resultados de los exaacutemenes (Habiacutea 12 estudiantes en la muestra) 13-24 Para los datos del ejercicio 13-18 y la siguiente salida de Minitab del procedimiento de regresiple hecho por Bill

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 3134 42 783 60Er r or 7 951 25 135 89Tot a l 11 4085 67

a) iquestCuaacutel es el valor observado de F b) A un nivel de significancia de 005 iquestcuaacutel es el valor criacutetico de F que se debe utilizar para d

si la regresioacuten como un todo es significativac) Basaacutendose en las respuestas a los incisos a) y b) iquestes la regresioacuten significativa como un tod

13-25 Remiacutetase al ejercicio 13-19 A un nivel de significancia de 001 iquestes la variable DISTANCIA uble explicativa significativa para VENTAS

13-26 Para los datos del ejercicio 13-19 y la siguiente salida adicional de Minitab al correr la regresioacuten

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 4 2861495 715374 102 39 0Er r or 18 125761 6896 7Tot a l 22 2987256

Al nivel de significancia de 005 iquestes la regresioacuten significativa como un todo

13-27 Henry Lander es el director de produccioacuten de la Alecos Corporation de Caracas Venezuela Hede que le ayude a determinar una foacutermula para predecir el ausentismo de los empacadores de chipoacutetesis es que la temperatura diaria promedio puede explicar el porcentaje de ausentismo Durios meses reuacutene datos ejecuta el procedimiento de regresioacuten simple y encuentra que la tempeplica 66 de la variacioacuten en el ausentismo Pero Henry no estaacute convencido de que eacuteste sea un cador satisfactorio Sugiere que la precipitacioacuten pluvial diaria podriacutea tambieacuten tener algo que vausentismo de modo que registra los datos correspondientes y hace una regresioacuten del ausentismte el tiempo de lluvias y obtiene un valor R2 de 059 ldquoiexclEurekardquo grita usted ldquoiexclLo tengo Con uticador que explica 66 y otro que explica 59 todo lo que tengo que hacer es una regresioacutenutilizando ambos y seguramente tendreacute un pronosticador casi perfectordquo Para su desaacutenimo sin la regresioacuten muacuteltiple tiene una R

2 de soacutelo 68 que es solamente un poco mejor que la variablperatura sola iquestCoacutemo puede explicar esta aparente discrepancia

13-28 Juan Armenlegg administrador de Rockyrsquos Diamond y Jewelry Store estaacute interesado en desamodelo para estimar la demanda del consumidor para su costosa mercanciacutea Como la mayoriacutea de

tes compran diamantes y joyas a creacutedito Juan estaacute seguro de que dos factores que deben influirmanda de los clientes son la tasa real de inflacioacuten anual y la tasa real de intereses sobre preacutestamprincipales bancos del paiacutes Explique algunos problemas que Juan podriacutea encontrar si fuera a dun modelo de regresioacuten basado en estas dos variables de prediccioacuten

13-29 Un nuevo programa de juegos Check That Model pide a los concursantes que especifiquen el nuacutenimo de paraacutemetros que necesitan para determinar si un modelo de regresioacuten muacuteltiple es signifimo un todo para ϭ 001 Usted ganoacute la apuesta con 4 paraacutemetros Use la siguiente informacioacutenterminar si la regresioacuten es significativa

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3056

R 2

ϭ 07452

SCE ϭ 1254

n ϭ 18

Nuacutemero de variables independientes ϭ 3

13-30 La Scottish Turist Agency estaacute interesada en el nuacutemero de turistas que entran al paiacutes cada semanrante la temporada alta Se recolectaron los siguientes datos

Turistas (Y ) ϭ nuacutemero de turistas que entran a Escocia en una semana (en miles)

Cambio (X 1)ϭ nuacutemero de libras escocesas compradas por $1 doacutelar

Precio (X 2) ϭ nuacutemero de libras escocesas cobradas por viaje redondo en camioacuten de Londres a Edimburgo

Promoc (X 3) ϭ cantidad gastada en promocioacuten del paiacutes (en miles de libras escocesas)Temp (X 4) ϭ temperatura media durante la semana en Edimburgo (en grados Celsius)

Turistas (Y ) Cambio (X 1) Precio (X 2) Promoc (X 3) Temp (X 4)

69 061 40 87 154

71 059 40 88 156

68 063 40 85 154

79 061 35 86 153

76 060 35 94 158

82 065 35 99 162

80 058 35 98 164

84 059 35 102 166

97 061 30 114 174

98 062 30 116 172

72 057 40 84 176

67 055 40 86 164

a) Utilice el paquete de software que tenga para determinar la ecuacioacuten de regresioacuten que mejote a los datos de la agencia de turismo

b) iquestEs la tasa de cambio una variable explicativa significativa Establezca y pruebe las hipoacutetesidas a un nivel de significancia de 010

c) Un incremento de 1000 libras en las promociones iquestaumenta el nuacutemero de turistas en maacutesEstablezca y pruebe las hipoacutetesis adecuadas para un nivel de significancia de 005

d) Calcule un intervalo de confianza del 95 para el coeficiente de la pendiente de Temp

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-4 Como SCT ϭ SCR ϩ SCE SCE ϭ SCT Ϫ SCR ϭ 10236 Ϫ 8724 ϭ 1512Como gl SCT ϭ gl SCR ϩ gl SCE gl SCR ϭ gl SCT Ϫ gl SCE ϭ 24 Ϫ 17 ϭ 7

Entonces F ϭ ϭ ϭ 1401

F CRiacuteT ϭ F (7 17 005) ϭ 261Como F OBS gt F CRIacuteT se concluye que la regresioacuten es significativa como un todo Edith debe conticando la salida de computadora de la regresioacuten para usarla en la junta

EA 13-5 De la salida de computadora se obti enen los siguientes resultadosa) VENTAS ϭ 17234 ϩ 25950PROMOC Ϫ13238COMPET Ϫ 3041GRATISb) H0 BGRATIS ϭ 0 H1 BGRATIS Ͻ 0 ϭ 005

Eacutesta es una prueba de una cola y el valor prob en los resultados es para la alternativa de dos c BGRATIS 0 De manera que para esta prueba el valor prob es 02212 ϭ 0111 Ͼ ϭ 00que no se puede rechazar H0 las ventas no disminuyen significativamente cuando aumenta ro de pasajeros que vuelan gratis

c) H0 BPROMOC ϭ 28 H1 BPROMOC 28 ϭ 010

87247ᎏᎏ

151217SCRk ᎏᎏ

SCE(n Ϫ k Ϫ 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3156

El valor observado t de los resultados de regresioacuten es

ϭ ϭ Ϫ0420

Con 11 grados de libertad y ϭ 010 en ambas colas combinadas los valores criacuteticos t parba son Ϯ1796 asiacute el valor observado estaacute dentro de la regioacuten de aceptacioacuten No se rechacambio en VENTAS para un incremento de una unidad ($1000) en PROMOC no es significate diferente de 28 ($28000)

d) Con 11 grados de libertad el valor t para un intervalo del 90 de confianza es 1796 por lo

tervalo esbCOMP Ϯ 1796sbCOMP

ϭ Ϫ13238 Ϯ 1796(3686)

ϭ Ϫ13238 Ϯ 6620 ϭ (Ϫ19858 Ϫ 6618)

La liacutenea aeacuterea puede tener una seguridad del 90 de que el ingreso por los boletos en una ofminuye entre $6600 y $19900 aproximadamente con cada liacutenea aeacuterea adicional que comp

135 Teacutecnicas de modelado

Dada una variable que deseamos explicar y un conjunto de variables explicativas potencialehaya varias ecuaciones de regresioacuten diferentes que podamos estudiar dependiendo de queacute explicativas incluyamos y de coacutemo lo hagamos Cada una de esas ecuaciones de regresioacutence como modelo Las teacutecnicas de modelado son las distintas formas en que podemos incluriables explicativas y verificar queacute tan apropiados son los modelos de regresioacuten Existen municas de modelado diferentes pero soacutelo veremos dos de las maacutes utilizadas

Datos cualitativos y variables ficticias

En todos los ejemplos de regresioacuten que hemos visto hasta ahora los datos manejados hanmeacutericos o cuantitativos Pero ocasionalmente nos enfrentaremos con una variable categoacuterilitativa En el problema del inicio el capiacutetulo el director de personal desea ver si el salarioun vendedor depende de su sexo En la tabla 13-5 repetimos los datos de dicho problema

Por el momento ignore la antiguumledad y utilice la teacutecnica desarrollada en el capiacutetulo 9 bar la diferencia entre las medias de dos poblaciones para ver si los hombres ganan maacutes qu

jeres Pruebe con ϭ 001 Si tomamos a los hombres como la poblacioacuten 1 y a las mujerespoblacioacuten 2 probaremos las siguientes hipoacutetesis

H0 1 ϭ 2 larr Hipoacutetesis nula no existe discriminacioacuten por sexo en los salarios base

H1 1 Ͼ 2 larr Hipoacutetesis alternativa se discrimina a las mujeres en su salario base

ϭ 001 larr Nivel de significancia

Revisioacuten del enfoqueanterior del problema

Buacutesqueda dediferentes modelos

25950 Ϫ 28ᎏᎏ

4877

(bPROMOC Ϫ 28)ᎏᎏ

sbPROMOC

Datos para el problemade discriminacioacuten porsexo

Tabla 13-5 Vendedores VendedorasAntiguumledad Salario base Antiguumledad Salario base(en meses) (en miles) (en meses) (en miles)

6 75 5 62

10 86 13 87

12 91 15 94

18 103 21 98

30 130

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3256

A continuacioacuten bosquejamos el anaacutelisis Si tiene problemas para seguirlo deberaacute repasamente la seccioacuten 93

n1 ϭ 5 n2 ϭ 4

x ෆ1 ϭ 97 x ෆ2 ϭ 8525

s2

1 ϭ 4415 s2

2 ϭ 2609

s2

p ϭ

ϭ

ϭ 3641

x ෆ1Ϫ x

ෆ2ϭ s pΊ ϩ

ϭ 128

t ϭ

ϭ

ϭ 092

Con siete grados de libertad el valor t criacutetico para una prueba de cola superior con ϭ 001 eComo el valor t observado de 092 es menor que 2998 no podemos rechazar H0

Entonces el anaacutelisis concluye que no parece haber discriminacioacuten por sexo en los salarPero recuerde que hasta ahora se han ignorado los datos de antiguumledad laboral para el anaacuteli

Antes de seguir vea el diagrama de dispersioacuten de los datos En la figura 13-9 los punto

corresponden a los hombres y los blancos a las mujeres El diagrama de dispersioacuten muestraridad que el salario base aumenta con los antildeos de antiguumledad pero si con la mirada sigue lo qla recta de regresioacuten notaraacute que los puntos negros tienden a estar arriba de ella y los blancos

La figura 13-10 da la salida de una regresioacuten del salario base sobre los meses de antiguumlelos resultados se ve que la antiguumledad es una variable explicativa altamente significativa

Ademaacutes r 2

ϭ 926 que indica que la variable meses de antiguumledad explica cerca del 9variacioacuten en el salario base La figura 13-11 contiene parte de la salida que no se vio antesbla de residuos Para cada punto el residuo es simplemente Y Ϫ Y ˆ que se reconoce como el

Una ldquomiradardquo a los

datos

El enfoque anterior nodetecta discriminacioacuten

(97 ndash 8525) ndash 0ᎏᎏ

128

( x ෆ1 ndash x ෆ2) ndash (1 Ϫ 2)H0

ᎏᎏᎏ

ˆ x ෆ1Ϫ

x ෆ2

1ᎏ

n2

1ᎏ

n1

4(4415) ϩ 3(2609)ᎏᎏᎏ5 ϩ 4 ndash 2

(n1 ndash 1)s21 ϩ (n2 ndash 1)s22ᎏᎏᎏ

n1 ϩ n2 ndash 2

FIGURA 13-9

Diagrama de dis-persioacuten de salariosbase contra mesesde antiguumledad

4 8 12 16 20 24 28

4

8

12

Meses de antiguumledad

S a l a r i o ( m i l e s d e d oacute l a r e s )

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3356

el ajuste de la recta de regresioacuten en ese punto En la figura 13-11 AJUST1 son los valores y RESI1 son los residuos

Tal vez la parte maacutes importante del anaacutelisis del resultado de una regresioacuten sea estusiduos Si la regresioacuten incluye todos los factores explicativos relevantes estos residuo

ser aleatorios Dicho de otro modo si los residuos muestran cualquier patroacuten no aleat

to indica que hay algo sistemaacutetico que afecta el proceso y que no hemos tomado en cu

manera que buscamos patrones en los residuos o para decirlo de forma maacutes pintoresca ldquopmos a los residuos hasta hacerlos hablarrdquo

Si observamos los residuos presentados en la figura 13-11 vemos que los primeros cincoson positivos De modo que para los vendedores tenemos Y ndash Y ˆ Ͼ 0 o Y Ͼ Y ˆ es decir laregresioacuten cae abajo de estos cinco puntos Tres de los cuatro uacuteltimos residuos son negaticonsiguiente para las vendedoras tenemos Y Ϫ Y ˆ Ͻ 0 o Y Ͻ Y ˆ asiacute que la recta de regresicuentra arriba de tres de los cuatro puntos Esto confirma lo que vimos al observar el diagdispersioacuten de la figura 13-9 Este patroacuten no aleatorio en los residuos sugiere que el sexo siacute etor determinante del salario base

iquestCoacutemo podemos incorporar el sexo de los vendedores dentro del modelo de regresioacutencemos utilizando un dispositivo llamado variable ficticia (o variable indicadora) Para lpuntos que representan a los vendedores esta variable tiene valor de 0 y para los cuatro purepresentan a las vendedoras valdraacute 1 Los datos de entrada para nuestra regresioacuten con variticias se dan en la tabla 13-6

Para los datos de la tabla 13-6 se ajusta una regresioacuten de la forma

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

Uso de variablesficticias

Deteccioacuten depatrones en losresiduos

ldquoPresionar a losresiduosrdquo

Anaacutel i s i s de r e gr e s i oacuten

La ec uac i oacuten de r e gr es i oacuten esSALARI O ϭ 5 81 ϩ 0 233 MESES

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t pCons t a nt e 5 8093 0 4038 14 39 0 000MESES 0 23320 0 02492 9 36 0 000

s ϭ 0 5494 R- s q ϭ 92 6

Anaacute l i s i s de va r i a nz aFUENTE GL SC MC F Re gr e s i oacuten 1 26 443 24 443 87 61 0Er r or 7 2 113 0 302Tot a l 8 28 556

FIGURA 13-10

Regresioacuten conMinitab del salariobase sobre losmeses deantiguumledad

RENGLOacuteN SALARI O AJ UST1 RESI 1

1 7 5 7 2085 0 2914992 8 6 8 1413 0 458684

3 9 1 8 6077 0 4922764 10 3 10 0069 0 2930545 13 0 12 8054 0 1946076 6 2 6 9753 - 0 7752977 8 7 8 8409 - 0 1409288 9 4 9 3073 0 0926649 9 8 10 7066 - 0 906558

FIGURA 13-11

Tabla de residuosde Minitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3056

R 2

ϭ 07452

SCE ϭ 1254

n ϭ 18

Nuacutemero de variables independientes ϭ 3

13-30 La Scottish Turist Agency estaacute interesada en el nuacutemero de turistas que entran al paiacutes cada semanrante la temporada alta Se recolectaron los siguientes datos

Turistas (Y ) ϭ nuacutemero de turistas que entran a Escocia en una semana (en miles)

Cambio (X 1)ϭ nuacutemero de libras escocesas compradas por $1 doacutelar

Precio (X 2) ϭ nuacutemero de libras escocesas cobradas por viaje redondo en camioacuten de Londres a Edimburgo

Promoc (X 3) ϭ cantidad gastada en promocioacuten del paiacutes (en miles de libras escocesas)Temp (X 4) ϭ temperatura media durante la semana en Edimburgo (en grados Celsius)

Turistas (Y ) Cambio (X 1) Precio (X 2) Promoc (X 3) Temp (X 4)

69 061 40 87 154

71 059 40 88 156

68 063 40 85 154

79 061 35 86 153

76 060 35 94 158

82 065 35 99 162

80 058 35 98 164

84 059 35 102 166

97 061 30 114 174

98 062 30 116 172

72 057 40 84 176

67 055 40 86 164

a) Utilice el paquete de software que tenga para determinar la ecuacioacuten de regresioacuten que mejote a los datos de la agencia de turismo

b) iquestEs la tasa de cambio una variable explicativa significativa Establezca y pruebe las hipoacutetesidas a un nivel de significancia de 010

c) Un incremento de 1000 libras en las promociones iquestaumenta el nuacutemero de turistas en maacutesEstablezca y pruebe las hipoacutetesis adecuadas para un nivel de significancia de 005

d) Calcule un intervalo de confianza del 95 para el coeficiente de la pendiente de Temp

Soluciones a los ejercicios de autoevaluacioacuten

EA 13-4 Como SCT ϭ SCR ϩ SCE SCE ϭ SCT Ϫ SCR ϭ 10236 Ϫ 8724 ϭ 1512Como gl SCT ϭ gl SCR ϩ gl SCE gl SCR ϭ gl SCT Ϫ gl SCE ϭ 24 Ϫ 17 ϭ 7

Entonces F ϭ ϭ ϭ 1401

F CRiacuteT ϭ F (7 17 005) ϭ 261Como F OBS gt F CRIacuteT se concluye que la regresioacuten es significativa como un todo Edith debe conticando la salida de computadora de la regresioacuten para usarla en la junta

EA 13-5 De la salida de computadora se obti enen los siguientes resultadosa) VENTAS ϭ 17234 ϩ 25950PROMOC Ϫ13238COMPET Ϫ 3041GRATISb) H0 BGRATIS ϭ 0 H1 BGRATIS Ͻ 0 ϭ 005

Eacutesta es una prueba de una cola y el valor prob en los resultados es para la alternativa de dos c BGRATIS 0 De manera que para esta prueba el valor prob es 02212 ϭ 0111 Ͼ ϭ 00que no se puede rechazar H0 las ventas no disminuyen significativamente cuando aumenta ro de pasajeros que vuelan gratis

c) H0 BPROMOC ϭ 28 H1 BPROMOC 28 ϭ 010

87247ᎏᎏ

151217SCRk ᎏᎏ

SCE(n Ϫ k Ϫ 1)

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3156

El valor observado t de los resultados de regresioacuten es

ϭ ϭ Ϫ0420

Con 11 grados de libertad y ϭ 010 en ambas colas combinadas los valores criacuteticos t parba son Ϯ1796 asiacute el valor observado estaacute dentro de la regioacuten de aceptacioacuten No se rechacambio en VENTAS para un incremento de una unidad ($1000) en PROMOC no es significate diferente de 28 ($28000)

d) Con 11 grados de libertad el valor t para un intervalo del 90 de confianza es 1796 por lo

tervalo esbCOMP Ϯ 1796sbCOMP

ϭ Ϫ13238 Ϯ 1796(3686)

ϭ Ϫ13238 Ϯ 6620 ϭ (Ϫ19858 Ϫ 6618)

La liacutenea aeacuterea puede tener una seguridad del 90 de que el ingreso por los boletos en una ofminuye entre $6600 y $19900 aproximadamente con cada liacutenea aeacuterea adicional que comp

135 Teacutecnicas de modelado

Dada una variable que deseamos explicar y un conjunto de variables explicativas potencialehaya varias ecuaciones de regresioacuten diferentes que podamos estudiar dependiendo de queacute explicativas incluyamos y de coacutemo lo hagamos Cada una de esas ecuaciones de regresioacutence como modelo Las teacutecnicas de modelado son las distintas formas en que podemos incluriables explicativas y verificar queacute tan apropiados son los modelos de regresioacuten Existen municas de modelado diferentes pero soacutelo veremos dos de las maacutes utilizadas

Datos cualitativos y variables ficticias

En todos los ejemplos de regresioacuten que hemos visto hasta ahora los datos manejados hanmeacutericos o cuantitativos Pero ocasionalmente nos enfrentaremos con una variable categoacuterilitativa En el problema del inicio el capiacutetulo el director de personal desea ver si el salarioun vendedor depende de su sexo En la tabla 13-5 repetimos los datos de dicho problema

Por el momento ignore la antiguumledad y utilice la teacutecnica desarrollada en el capiacutetulo 9 bar la diferencia entre las medias de dos poblaciones para ver si los hombres ganan maacutes qu

jeres Pruebe con ϭ 001 Si tomamos a los hombres como la poblacioacuten 1 y a las mujerespoblacioacuten 2 probaremos las siguientes hipoacutetesis

H0 1 ϭ 2 larr Hipoacutetesis nula no existe discriminacioacuten por sexo en los salarios base

H1 1 Ͼ 2 larr Hipoacutetesis alternativa se discrimina a las mujeres en su salario base

ϭ 001 larr Nivel de significancia

Revisioacuten del enfoqueanterior del problema

Buacutesqueda dediferentes modelos

25950 Ϫ 28ᎏᎏ

4877

(bPROMOC Ϫ 28)ᎏᎏ

sbPROMOC

Datos para el problemade discriminacioacuten porsexo

Tabla 13-5 Vendedores VendedorasAntiguumledad Salario base Antiguumledad Salario base(en meses) (en miles) (en meses) (en miles)

6 75 5 62

10 86 13 87

12 91 15 94

18 103 21 98

30 130

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3256

A continuacioacuten bosquejamos el anaacutelisis Si tiene problemas para seguirlo deberaacute repasamente la seccioacuten 93

n1 ϭ 5 n2 ϭ 4

x ෆ1 ϭ 97 x ෆ2 ϭ 8525

s2

1 ϭ 4415 s2

2 ϭ 2609

s2

p ϭ

ϭ

ϭ 3641

x ෆ1Ϫ x

ෆ2ϭ s pΊ ϩ

ϭ 128

t ϭ

ϭ

ϭ 092

Con siete grados de libertad el valor t criacutetico para una prueba de cola superior con ϭ 001 eComo el valor t observado de 092 es menor que 2998 no podemos rechazar H0

Entonces el anaacutelisis concluye que no parece haber discriminacioacuten por sexo en los salarPero recuerde que hasta ahora se han ignorado los datos de antiguumledad laboral para el anaacuteli

Antes de seguir vea el diagrama de dispersioacuten de los datos En la figura 13-9 los punto

corresponden a los hombres y los blancos a las mujeres El diagrama de dispersioacuten muestraridad que el salario base aumenta con los antildeos de antiguumledad pero si con la mirada sigue lo qla recta de regresioacuten notaraacute que los puntos negros tienden a estar arriba de ella y los blancos

La figura 13-10 da la salida de una regresioacuten del salario base sobre los meses de antiguumlelos resultados se ve que la antiguumledad es una variable explicativa altamente significativa

Ademaacutes r 2

ϭ 926 que indica que la variable meses de antiguumledad explica cerca del 9variacioacuten en el salario base La figura 13-11 contiene parte de la salida que no se vio antesbla de residuos Para cada punto el residuo es simplemente Y Ϫ Y ˆ que se reconoce como el

Una ldquomiradardquo a los

datos

El enfoque anterior nodetecta discriminacioacuten

(97 ndash 8525) ndash 0ᎏᎏ

128

( x ෆ1 ndash x ෆ2) ndash (1 Ϫ 2)H0

ᎏᎏᎏ

ˆ x ෆ1Ϫ

x ෆ2

1ᎏ

n2

1ᎏ

n1

4(4415) ϩ 3(2609)ᎏᎏᎏ5 ϩ 4 ndash 2

(n1 ndash 1)s21 ϩ (n2 ndash 1)s22ᎏᎏᎏ

n1 ϩ n2 ndash 2

FIGURA 13-9

Diagrama de dis-persioacuten de salariosbase contra mesesde antiguumledad

4 8 12 16 20 24 28

4

8

12

Meses de antiguumledad

S a l a r i o ( m i l e s d e d oacute l a r e s )

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3356

el ajuste de la recta de regresioacuten en ese punto En la figura 13-11 AJUST1 son los valores y RESI1 son los residuos

Tal vez la parte maacutes importante del anaacutelisis del resultado de una regresioacuten sea estusiduos Si la regresioacuten incluye todos los factores explicativos relevantes estos residuo

ser aleatorios Dicho de otro modo si los residuos muestran cualquier patroacuten no aleat

to indica que hay algo sistemaacutetico que afecta el proceso y que no hemos tomado en cu

manera que buscamos patrones en los residuos o para decirlo de forma maacutes pintoresca ldquopmos a los residuos hasta hacerlos hablarrdquo

Si observamos los residuos presentados en la figura 13-11 vemos que los primeros cincoson positivos De modo que para los vendedores tenemos Y ndash Y ˆ Ͼ 0 o Y Ͼ Y ˆ es decir laregresioacuten cae abajo de estos cinco puntos Tres de los cuatro uacuteltimos residuos son negaticonsiguiente para las vendedoras tenemos Y Ϫ Y ˆ Ͻ 0 o Y Ͻ Y ˆ asiacute que la recta de regresicuentra arriba de tres de los cuatro puntos Esto confirma lo que vimos al observar el diagdispersioacuten de la figura 13-9 Este patroacuten no aleatorio en los residuos sugiere que el sexo siacute etor determinante del salario base

iquestCoacutemo podemos incorporar el sexo de los vendedores dentro del modelo de regresioacutencemos utilizando un dispositivo llamado variable ficticia (o variable indicadora) Para lpuntos que representan a los vendedores esta variable tiene valor de 0 y para los cuatro purepresentan a las vendedoras valdraacute 1 Los datos de entrada para nuestra regresioacuten con variticias se dan en la tabla 13-6

Para los datos de la tabla 13-6 se ajusta una regresioacuten de la forma

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

Uso de variablesficticias

Deteccioacuten depatrones en losresiduos

ldquoPresionar a losresiduosrdquo

Anaacutel i s i s de r e gr e s i oacuten

La ec uac i oacuten de r e gr es i oacuten esSALARI O ϭ 5 81 ϩ 0 233 MESES

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t pCons t a nt e 5 8093 0 4038 14 39 0 000MESES 0 23320 0 02492 9 36 0 000

s ϭ 0 5494 R- s q ϭ 92 6

Anaacute l i s i s de va r i a nz aFUENTE GL SC MC F Re gr e s i oacuten 1 26 443 24 443 87 61 0Er r or 7 2 113 0 302Tot a l 8 28 556

FIGURA 13-10

Regresioacuten conMinitab del salariobase sobre losmeses deantiguumledad

RENGLOacuteN SALARI O AJ UST1 RESI 1

1 7 5 7 2085 0 2914992 8 6 8 1413 0 458684

3 9 1 8 6077 0 4922764 10 3 10 0069 0 2930545 13 0 12 8054 0 1946076 6 2 6 9753 - 0 7752977 8 7 8 8409 - 0 1409288 9 4 9 3073 0 0926649 9 8 10 7066 - 0 906558

FIGURA 13-11

Tabla de residuosde Minitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3156

El valor observado t de los resultados de regresioacuten es

ϭ ϭ Ϫ0420

Con 11 grados de libertad y ϭ 010 en ambas colas combinadas los valores criacuteticos t parba son Ϯ1796 asiacute el valor observado estaacute dentro de la regioacuten de aceptacioacuten No se rechacambio en VENTAS para un incremento de una unidad ($1000) en PROMOC no es significate diferente de 28 ($28000)

d) Con 11 grados de libertad el valor t para un intervalo del 90 de confianza es 1796 por lo

tervalo esbCOMP Ϯ 1796sbCOMP

ϭ Ϫ13238 Ϯ 1796(3686)

ϭ Ϫ13238 Ϯ 6620 ϭ (Ϫ19858 Ϫ 6618)

La liacutenea aeacuterea puede tener una seguridad del 90 de que el ingreso por los boletos en una ofminuye entre $6600 y $19900 aproximadamente con cada liacutenea aeacuterea adicional que comp

135 Teacutecnicas de modelado

Dada una variable que deseamos explicar y un conjunto de variables explicativas potencialehaya varias ecuaciones de regresioacuten diferentes que podamos estudiar dependiendo de queacute explicativas incluyamos y de coacutemo lo hagamos Cada una de esas ecuaciones de regresioacutence como modelo Las teacutecnicas de modelado son las distintas formas en que podemos incluriables explicativas y verificar queacute tan apropiados son los modelos de regresioacuten Existen municas de modelado diferentes pero soacutelo veremos dos de las maacutes utilizadas

Datos cualitativos y variables ficticias

En todos los ejemplos de regresioacuten que hemos visto hasta ahora los datos manejados hanmeacutericos o cuantitativos Pero ocasionalmente nos enfrentaremos con una variable categoacuterilitativa En el problema del inicio el capiacutetulo el director de personal desea ver si el salarioun vendedor depende de su sexo En la tabla 13-5 repetimos los datos de dicho problema

Por el momento ignore la antiguumledad y utilice la teacutecnica desarrollada en el capiacutetulo 9 bar la diferencia entre las medias de dos poblaciones para ver si los hombres ganan maacutes qu

jeres Pruebe con ϭ 001 Si tomamos a los hombres como la poblacioacuten 1 y a las mujerespoblacioacuten 2 probaremos las siguientes hipoacutetesis

H0 1 ϭ 2 larr Hipoacutetesis nula no existe discriminacioacuten por sexo en los salarios base

H1 1 Ͼ 2 larr Hipoacutetesis alternativa se discrimina a las mujeres en su salario base

ϭ 001 larr Nivel de significancia

Revisioacuten del enfoqueanterior del problema

Buacutesqueda dediferentes modelos

25950 Ϫ 28ᎏᎏ

4877

(bPROMOC Ϫ 28)ᎏᎏ

sbPROMOC

Datos para el problemade discriminacioacuten porsexo

Tabla 13-5 Vendedores VendedorasAntiguumledad Salario base Antiguumledad Salario base(en meses) (en miles) (en meses) (en miles)

6 75 5 62

10 86 13 87

12 91 15 94

18 103 21 98

30 130

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3256

A continuacioacuten bosquejamos el anaacutelisis Si tiene problemas para seguirlo deberaacute repasamente la seccioacuten 93

n1 ϭ 5 n2 ϭ 4

x ෆ1 ϭ 97 x ෆ2 ϭ 8525

s2

1 ϭ 4415 s2

2 ϭ 2609

s2

p ϭ

ϭ

ϭ 3641

x ෆ1Ϫ x

ෆ2ϭ s pΊ ϩ

ϭ 128

t ϭ

ϭ

ϭ 092

Con siete grados de libertad el valor t criacutetico para una prueba de cola superior con ϭ 001 eComo el valor t observado de 092 es menor que 2998 no podemos rechazar H0

Entonces el anaacutelisis concluye que no parece haber discriminacioacuten por sexo en los salarPero recuerde que hasta ahora se han ignorado los datos de antiguumledad laboral para el anaacuteli

Antes de seguir vea el diagrama de dispersioacuten de los datos En la figura 13-9 los punto

corresponden a los hombres y los blancos a las mujeres El diagrama de dispersioacuten muestraridad que el salario base aumenta con los antildeos de antiguumledad pero si con la mirada sigue lo qla recta de regresioacuten notaraacute que los puntos negros tienden a estar arriba de ella y los blancos

La figura 13-10 da la salida de una regresioacuten del salario base sobre los meses de antiguumlelos resultados se ve que la antiguumledad es una variable explicativa altamente significativa

Ademaacutes r 2

ϭ 926 que indica que la variable meses de antiguumledad explica cerca del 9variacioacuten en el salario base La figura 13-11 contiene parte de la salida que no se vio antesbla de residuos Para cada punto el residuo es simplemente Y Ϫ Y ˆ que se reconoce como el

Una ldquomiradardquo a los

datos

El enfoque anterior nodetecta discriminacioacuten

(97 ndash 8525) ndash 0ᎏᎏ

128

( x ෆ1 ndash x ෆ2) ndash (1 Ϫ 2)H0

ᎏᎏᎏ

ˆ x ෆ1Ϫ

x ෆ2

1ᎏ

n2

1ᎏ

n1

4(4415) ϩ 3(2609)ᎏᎏᎏ5 ϩ 4 ndash 2

(n1 ndash 1)s21 ϩ (n2 ndash 1)s22ᎏᎏᎏ

n1 ϩ n2 ndash 2

FIGURA 13-9

Diagrama de dis-persioacuten de salariosbase contra mesesde antiguumledad

4 8 12 16 20 24 28

4

8

12

Meses de antiguumledad

S a l a r i o ( m i l e s d e d oacute l a r e s )

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3356

el ajuste de la recta de regresioacuten en ese punto En la figura 13-11 AJUST1 son los valores y RESI1 son los residuos

Tal vez la parte maacutes importante del anaacutelisis del resultado de una regresioacuten sea estusiduos Si la regresioacuten incluye todos los factores explicativos relevantes estos residuo

ser aleatorios Dicho de otro modo si los residuos muestran cualquier patroacuten no aleat

to indica que hay algo sistemaacutetico que afecta el proceso y que no hemos tomado en cu

manera que buscamos patrones en los residuos o para decirlo de forma maacutes pintoresca ldquopmos a los residuos hasta hacerlos hablarrdquo

Si observamos los residuos presentados en la figura 13-11 vemos que los primeros cincoson positivos De modo que para los vendedores tenemos Y ndash Y ˆ Ͼ 0 o Y Ͼ Y ˆ es decir laregresioacuten cae abajo de estos cinco puntos Tres de los cuatro uacuteltimos residuos son negaticonsiguiente para las vendedoras tenemos Y Ϫ Y ˆ Ͻ 0 o Y Ͻ Y ˆ asiacute que la recta de regresicuentra arriba de tres de los cuatro puntos Esto confirma lo que vimos al observar el diagdispersioacuten de la figura 13-9 Este patroacuten no aleatorio en los residuos sugiere que el sexo siacute etor determinante del salario base

iquestCoacutemo podemos incorporar el sexo de los vendedores dentro del modelo de regresioacutencemos utilizando un dispositivo llamado variable ficticia (o variable indicadora) Para lpuntos que representan a los vendedores esta variable tiene valor de 0 y para los cuatro purepresentan a las vendedoras valdraacute 1 Los datos de entrada para nuestra regresioacuten con variticias se dan en la tabla 13-6

Para los datos de la tabla 13-6 se ajusta una regresioacuten de la forma

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

Uso de variablesficticias

Deteccioacuten depatrones en losresiduos

ldquoPresionar a losresiduosrdquo

Anaacutel i s i s de r e gr e s i oacuten

La ec uac i oacuten de r e gr es i oacuten esSALARI O ϭ 5 81 ϩ 0 233 MESES

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t pCons t a nt e 5 8093 0 4038 14 39 0 000MESES 0 23320 0 02492 9 36 0 000

s ϭ 0 5494 R- s q ϭ 92 6

Anaacute l i s i s de va r i a nz aFUENTE GL SC MC F Re gr e s i oacuten 1 26 443 24 443 87 61 0Er r or 7 2 113 0 302Tot a l 8 28 556

FIGURA 13-10

Regresioacuten conMinitab del salariobase sobre losmeses deantiguumledad

RENGLOacuteN SALARI O AJ UST1 RESI 1

1 7 5 7 2085 0 2914992 8 6 8 1413 0 458684

3 9 1 8 6077 0 4922764 10 3 10 0069 0 2930545 13 0 12 8054 0 1946076 6 2 6 9753 - 0 7752977 8 7 8 8409 - 0 1409288 9 4 9 3073 0 0926649 9 8 10 7066 - 0 906558

FIGURA 13-11

Tabla de residuosde Minitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3256

A continuacioacuten bosquejamos el anaacutelisis Si tiene problemas para seguirlo deberaacute repasamente la seccioacuten 93

n1 ϭ 5 n2 ϭ 4

x ෆ1 ϭ 97 x ෆ2 ϭ 8525

s2

1 ϭ 4415 s2

2 ϭ 2609

s2

p ϭ

ϭ

ϭ 3641

x ෆ1Ϫ x

ෆ2ϭ s pΊ ϩ

ϭ 128

t ϭ

ϭ

ϭ 092

Con siete grados de libertad el valor t criacutetico para una prueba de cola superior con ϭ 001 eComo el valor t observado de 092 es menor que 2998 no podemos rechazar H0

Entonces el anaacutelisis concluye que no parece haber discriminacioacuten por sexo en los salarPero recuerde que hasta ahora se han ignorado los datos de antiguumledad laboral para el anaacuteli

Antes de seguir vea el diagrama de dispersioacuten de los datos En la figura 13-9 los punto

corresponden a los hombres y los blancos a las mujeres El diagrama de dispersioacuten muestraridad que el salario base aumenta con los antildeos de antiguumledad pero si con la mirada sigue lo qla recta de regresioacuten notaraacute que los puntos negros tienden a estar arriba de ella y los blancos

La figura 13-10 da la salida de una regresioacuten del salario base sobre los meses de antiguumlelos resultados se ve que la antiguumledad es una variable explicativa altamente significativa

Ademaacutes r 2

ϭ 926 que indica que la variable meses de antiguumledad explica cerca del 9variacioacuten en el salario base La figura 13-11 contiene parte de la salida que no se vio antesbla de residuos Para cada punto el residuo es simplemente Y Ϫ Y ˆ que se reconoce como el

Una ldquomiradardquo a los

datos

El enfoque anterior nodetecta discriminacioacuten

(97 ndash 8525) ndash 0ᎏᎏ

128

( x ෆ1 ndash x ෆ2) ndash (1 Ϫ 2)H0

ᎏᎏᎏ

ˆ x ෆ1Ϫ

x ෆ2

1ᎏ

n2

1ᎏ

n1

4(4415) ϩ 3(2609)ᎏᎏᎏ5 ϩ 4 ndash 2

(n1 ndash 1)s21 ϩ (n2 ndash 1)s22ᎏᎏᎏ

n1 ϩ n2 ndash 2

FIGURA 13-9

Diagrama de dis-persioacuten de salariosbase contra mesesde antiguumledad

4 8 12 16 20 24 28

4

8

12

Meses de antiguumledad

S a l a r i o ( m i l e s d e d oacute l a r e s )

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3356

el ajuste de la recta de regresioacuten en ese punto En la figura 13-11 AJUST1 son los valores y RESI1 son los residuos

Tal vez la parte maacutes importante del anaacutelisis del resultado de una regresioacuten sea estusiduos Si la regresioacuten incluye todos los factores explicativos relevantes estos residuo

ser aleatorios Dicho de otro modo si los residuos muestran cualquier patroacuten no aleat

to indica que hay algo sistemaacutetico que afecta el proceso y que no hemos tomado en cu

manera que buscamos patrones en los residuos o para decirlo de forma maacutes pintoresca ldquopmos a los residuos hasta hacerlos hablarrdquo

Si observamos los residuos presentados en la figura 13-11 vemos que los primeros cincoson positivos De modo que para los vendedores tenemos Y ndash Y ˆ Ͼ 0 o Y Ͼ Y ˆ es decir laregresioacuten cae abajo de estos cinco puntos Tres de los cuatro uacuteltimos residuos son negaticonsiguiente para las vendedoras tenemos Y Ϫ Y ˆ Ͻ 0 o Y Ͻ Y ˆ asiacute que la recta de regresicuentra arriba de tres de los cuatro puntos Esto confirma lo que vimos al observar el diagdispersioacuten de la figura 13-9 Este patroacuten no aleatorio en los residuos sugiere que el sexo siacute etor determinante del salario base

iquestCoacutemo podemos incorporar el sexo de los vendedores dentro del modelo de regresioacutencemos utilizando un dispositivo llamado variable ficticia (o variable indicadora) Para lpuntos que representan a los vendedores esta variable tiene valor de 0 y para los cuatro purepresentan a las vendedoras valdraacute 1 Los datos de entrada para nuestra regresioacuten con variticias se dan en la tabla 13-6

Para los datos de la tabla 13-6 se ajusta una regresioacuten de la forma

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

Uso de variablesficticias

Deteccioacuten depatrones en losresiduos

ldquoPresionar a losresiduosrdquo

Anaacutel i s i s de r e gr e s i oacuten

La ec uac i oacuten de r e gr es i oacuten esSALARI O ϭ 5 81 ϩ 0 233 MESES

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t pCons t a nt e 5 8093 0 4038 14 39 0 000MESES 0 23320 0 02492 9 36 0 000

s ϭ 0 5494 R- s q ϭ 92 6

Anaacute l i s i s de va r i a nz aFUENTE GL SC MC F Re gr e s i oacuten 1 26 443 24 443 87 61 0Er r or 7 2 113 0 302Tot a l 8 28 556

FIGURA 13-10

Regresioacuten conMinitab del salariobase sobre losmeses deantiguumledad

RENGLOacuteN SALARI O AJ UST1 RESI 1

1 7 5 7 2085 0 2914992 8 6 8 1413 0 458684

3 9 1 8 6077 0 4922764 10 3 10 0069 0 2930545 13 0 12 8054 0 1946076 6 2 6 9753 - 0 7752977 8 7 8 8409 - 0 1409288 9 4 9 3073 0 0926649 9 8 10 7066 - 0 906558

FIGURA 13-11

Tabla de residuosde Minitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3356

el ajuste de la recta de regresioacuten en ese punto En la figura 13-11 AJUST1 son los valores y RESI1 son los residuos

Tal vez la parte maacutes importante del anaacutelisis del resultado de una regresioacuten sea estusiduos Si la regresioacuten incluye todos los factores explicativos relevantes estos residuo

ser aleatorios Dicho de otro modo si los residuos muestran cualquier patroacuten no aleat

to indica que hay algo sistemaacutetico que afecta el proceso y que no hemos tomado en cu

manera que buscamos patrones en los residuos o para decirlo de forma maacutes pintoresca ldquopmos a los residuos hasta hacerlos hablarrdquo

Si observamos los residuos presentados en la figura 13-11 vemos que los primeros cincoson positivos De modo que para los vendedores tenemos Y ndash Y ˆ Ͼ 0 o Y Ͼ Y ˆ es decir laregresioacuten cae abajo de estos cinco puntos Tres de los cuatro uacuteltimos residuos son negaticonsiguiente para las vendedoras tenemos Y Ϫ Y ˆ Ͻ 0 o Y Ͻ Y ˆ asiacute que la recta de regresicuentra arriba de tres de los cuatro puntos Esto confirma lo que vimos al observar el diagdispersioacuten de la figura 13-9 Este patroacuten no aleatorio en los residuos sugiere que el sexo siacute etor determinante del salario base

iquestCoacutemo podemos incorporar el sexo de los vendedores dentro del modelo de regresioacutencemos utilizando un dispositivo llamado variable ficticia (o variable indicadora) Para lpuntos que representan a los vendedores esta variable tiene valor de 0 y para los cuatro purepresentan a las vendedoras valdraacute 1 Los datos de entrada para nuestra regresioacuten con variticias se dan en la tabla 13-6

Para los datos de la tabla 13-6 se ajusta una regresioacuten de la forma

Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

Uso de variablesficticias

Deteccioacuten depatrones en losresiduos

ldquoPresionar a losresiduosrdquo

Anaacutel i s i s de r e gr e s i oacuten

La ec uac i oacuten de r e gr es i oacuten esSALARI O ϭ 5 81 ϩ 0 233 MESES

Pr onos t i c a dor Coe f De s vEs t Coc i e nt e - t pCons t a nt e 5 8093 0 4038 14 39 0 000MESES 0 23320 0 02492 9 36 0 000

s ϭ 0 5494 R- s q ϭ 92 6

Anaacute l i s i s de va r i a nz aFUENTE GL SC MC F Re gr e s i oacuten 1 26 443 24 443 87 61 0Er r or 7 2 113 0 302Tot a l 8 28 556

FIGURA 13-10

Regresioacuten conMinitab del salariobase sobre losmeses deantiguumledad

RENGLOacuteN SALARI O AJ UST1 RESI 1

1 7 5 7 2085 0 2914992 8 6 8 1413 0 458684

3 9 1 8 6077 0 4922764 10 3 10 0069 0 2930545 13 0 12 8054 0 1946076 6 2 6 9753 - 0 7752977 8 7 8 8409 - 0 1409288 9 4 9 3073 0 0926649 9 8 10 7066 - 0 906558

FIGURA 13-11

Tabla de residuosde Minitab

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3456

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3556

es t c ϭ Ϫ3143 En la figura 13-12 vemos que el coeficiente de regresioacuten estandarizado patra prueba es t o ϭ Ϫ331 En la figura 13-13 se ilustra el valor criacutetico y el coeficiente estandEl coeficiente observado b2 queda fuera de la regioacuten de aceptacioacuten de modo que rech

la hipoacutetesis nula y llegamos a la conclusioacuten de que la empresa discrimina a sus vended

paso tambieacuten notamos que el valor calculado de t para b1 en esta regresioacuten es 1409 asiacute qclusioacuten del sexo como una variable explicativa hace que la antiguumledad sea maacutes significativariable explicativa que antes La figura 13-14 proporciona la salida de Minitab de los valotados y los residuos para esta regresioacuten Como fue la segunda regresioacuten que se corrioacute sobre tos Minitab ahora llama AJUST2 y RESI2 a estos valores Observe que los residuos de es

sioacuten no parecen mostrar ninguacuten patroacuten no aleatorioRevisemos la forma en que manejamos la variable cualitativa en este problema Establecvariable ficticia le asignamos un valor de 0 para los hombres y 1 para las mujeres Entoncesciente de la variable ficticia se puede interpretar como la diferencia entre el salario base de

jer y el salario base de un hombre Suponga que se fija la variable ficticia en 0 para las mupara los hombres Entonces su coeficiente seriacutea la diferencia entre el salario base de un homde una mujer en ese orden iquestPodriacutea decir cuaacutel hubiera sido el resultado de la regresioacuten en eNo debe sorprenderle encontrar que el resultado hubiera sido

Y ˆ ϭ 54595 ϩ 022707 X 1 ϩ 07890 X 2

La eleccioacuten de a queacute categoriacutea se le da el valor de 0 y a cuaacutel el de 1 es totalmente arb

soacutelo afecta el signo no el valor numeacuterico del coeficiente de la variable ficticiaNuestro ejemplo teniacutea soacutelo una variable cualitativa (el sexo) y esa variable nada maacutes

categoriacuteas posibles (hombre y mujer) Aunque no veremos los detalles aquiacute las teacutecnicas de ficticias tambieacuten se pueden utilizar en problemas que contienen varias variables cualitativasden tener maacutes de dos categoriacuteas posibles

Extensiones de lasteacutecnicas de variablesficticia

Interpretacioacutendel coeficientede la variable ficticia

FIGURA 13-13

Prueba dehipoacutetesis de colaizquierda al nivelde significancia de

001 que ilustrala regioacuten deaceptacioacuten y elcoeficiente deregresioacutenestandarizado

Regioacuten de aceptacioacuten

Coeficientede regresioacutenestandarizadondash331

Acepte la hipoacutetesis nula si el valormuestral estaacute en esta regioacuten

0ndash3143t

FIGURA 13-14

Tabla de residuos

de Minitab

RENGLOacuteN SALARI O AJ UST2 RESI 2

1 7 5 7 6109 - 0 1109212 8 6 8 5192 0 0807843 9 1 8 9734 0 1266374 10 3 10 3358 - 0 0358075 13 0 13 0607 - 0 0606926 6 2 6 5949 - 0 3948737 8 7 8 4115 0 2885378 9 4 8 8656 0 5343899 9 8 10 2281 - 0 428053

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3656

Transformacioacuten de variables y curvas de ajuste

Un fabricante de motores eleacutectricos pequentildeos utiliza una fresadora automaacutetica para hacer lras en el eje de los motores Se procesa un lote de ejes y luego se verifica Todos los ejes delno cumplen con las especificaciones del tamantildeo de ranura requerido se descartan Al iniciolote se calibra la fresadora ya que la cabeza cortadora se desgasta un poco durante la producada lote El fabricante desea obtener un tamantildeo de lote oacuteptimo pero para lograrlo debe smo afecta el tamantildeo del lote al nuacutemero de ejes defectuosos La tabla 13-7 contiene los datopondientes a una muestra de 30 lotes clasificados seguacuten el tamantildeo

La figura 13-15 es un diagrama de dispersioacuten para estos datos Como hay dos lotes de 2534 defectuosos en cada uno dos de los puntos del diagrama de dispersioacuten coinciden (esto code al punto maacutes grande en la figura 13-15)

Haremos una regresioacuten del nuacutemero de ejes defectuosos sobre el tamantildeo del lote La saliregresioacuten se da en las figuras 13-16 y 13-17 iquestQueacute nos dice este resultado Primero que edel lote desempentildea un magniacutefico papel al explicar el nuacutemero de ejes defectuosos el valor ct es 2394 y r

2ϭ 953 Sin embargo a pesar del valor t increiacuteblemente alto y del hecho d

Observacioacuten de unpatroacuten en los residuos

Nuacutemero de ejesdefectuosos por lote

Tabla 13-7 Tamantildeo de lote Nuacutem de defectos Tamantildeo de lote Nuacutem de d

100 5 250 37

125 10 250 41125 6 250 34

125 7 275 49

150 6 300 53

150 7 300 54

175 17 325 69

175 15 350 82

200 24 350 81

200 21 350 84

200 22 375 92

225 26 375 96

225 29 375 97

225 25 400 109250 34 400 112

FIGURA 13-15

Diagrama de dis-persioacuten de ejesdefectuosos contratamantildeo del lote

100 200 300 4000

20

40

60

80

100

120

Tamantildeo del lote

E j e s d e f e c

t u o s o s

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3756

FIGURA 13-16

Salida de Minitabpara la regresioacutende defectos sobretamantildeo de lote

Anaacutel i s i s de r e gr e s i oacuten

La ec uaci oacuten de r egr es i oacuten esDEFECTOS ϭ minus 47 9 ϩ 0 367 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e - 47 901 4 112 - 11 65 0 000TAMANtildeLOT 0 036713 0 01534 23 94 0 000

s ϭ 7 560 R- s q ϭ 95 3

Anaacutel i s i s de var i anz aFUENTE GL SC MC F pRegr es i oacuten 1 32744 32744 572 90 0 000Er r or 28 1600 57Tot al 29 34345

FIGURA 13-17

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 - 11 1875 16 18752 10 - 2 0093 12 00933 6 - 2 0093 8 00934 7 - 2 0093 9 0093

5 6 7 1690 - 1 16906 7 7 1690 - 0 16907 17 16 3473 0 65278 15 16 3473 - 1 34739 24 25 5256 - 1 5256

10 21 25 5256 - 4 525611 22 25 5256 - 3 525612 26 34 7039 - 8 703913 29 34 7039 - 5 703914 25 34 7039 - 9 703915 34 43 8822 - 9 882216 37 43 8822 - 6 8822

17 41 43 8822 - 2 882218 34 43 8822 - 9 882219 49 53 0605 - 4 060520 53 62 2387 - 9 238721 54 62 2387 - 8 238722 69 71 4170 - 2 417023 82 80 5953 1 404724 81 80 5953 0 404725 84 80 5953 3 404726 92 89 7736 2 226427 96 89 7736 6 226428 97 89 7736 7 2264

29 109 98 9519 10 048130 112 98 9519 13 0481

tamantildeo del lote explica el 95 de la variacioacuten en el nuacutemero de defectos los residuos en esioacuten estaacuten lejos de ser aleatorios Note coacutemo empiezan con valores positivos grandes dismse hacen cada vez maacutes negativos y luego regresan para terminar con valores positivos gran

iquestQueacute nos indica esto Observe la figura 13-18 en la que hemos ajustado una recta de rtrazada en negro (Y ˆ ϭ Ϫ7 ϩ 7 X ) a los ocho puntos ( X Y ) ϭ (00) (1l) (24) (39) (7se encuentran sobre la curva gris (Y ϭ X 2) La figura tambieacuten muestra los residuos y su sig

Queacute sugiere el patroacuten

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3856

El patroacuten de residuos que obtuvimos en el problema de los ejes es bastante parecido al paservado en la figura 13-18 Quizaacute los datos de los ejes se aproximen mejor por una curvauna recta Observe nuevamente la figura 13-15 iquestQueacute cree usted

Pero soacutelo hemos ajustado liacuteneas rectas iquestCoacutemo debemos proceder para ajustar una curvacedimiento es sencillo Soacutelo debemos introducir otra variable X 2 ϭ (tamantildeo del lote)2 y lulizar una regresioacuten muacuteltiple Los datos de entrada se presentan en la tabla 13-8 y los resullas figuras 13-19 y 13-20

Observando la figura 13-19 vemos que tamantildeo de lote y (tamantildeo de lote)2 son ambas vexplicativas significativas ya que sus valores t son Ϫ382 y 1567 respectivamente El co

de determinacioacuten muacuteltiple es R2 ϭ 995 asiacute que juntas las dos variables explican el 99variacioacuten en el nuacutemero de ejes defectuosos Como uacuteltima comparacioacuten de las dos regresioque el error estaacutendar de la estimacioacuten que mide la dispersioacuten de los puntos de la muestra a

La curva es muchomejor que la recta

Ajuste de una curvaa los datos

FIGURA 13-18

Ajuste de unarecta a los puntosde una curva

-10

0

10

20

30

40

50

7654321

Y

X

Y = X 2

Y = ndash7 + 7X ^

+

+

+

ndash

ndash

ndash

ndash

+

Datos de entrada parael ajuste de una curvaa los datos de los ejesde motor

Tabla 13-8 X 1 X 2 Y X 1 X 2

Tamantildeo (tamantildeo Nuacutemero Tamantildeo (tamantildeo Nuacutede lote de lote)2 de defectos de lote de lote)2 de d

100 10000 5 250 62500 125 15625 10 250 62500 125 15625 6 250 62500

125 15625 7 275 75625

150 22500 6 300 90000 150 22500 7 300 90000

175 30625 17 325 105625

175 30625 15 350 122500

200 40000 24 350 122500

200 40000 21 350 122500

200 40000 22 375 140625

225 50625 26 375 140625

225 50625 29 375 140625

225 50625 25 400 160000 1

250 62500 34 400 160000 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 3956

del modelo ajustado es 7560 para el modelo de la recta y soacutelo 2423 para el modelo de la modelo curviliacuteneo es superior que el modelo de la recta iexcla pesar de que este uacuteltimo exp

de la variacioacuten Recuerde que fue el patroacuten observado en los residuos del modelo de la

que sugirioacute que un modelo curviliacuteneo seriacutea maacutes apropiado Los residuos del modelo d

va en la figura 13-20 no exhiben patroacuten alguno

FIGURA 13-19

Salida de Minitabpara la regresioacutensobre tamantildeo delote y (tamantildeode lote)2

Anaacutel i s i s de r e gr e s i oacuten

La ecua ci oacuten de r egr es i oacuten esDEFECTOS ϭ 6 90 minus 0 120 TAMANtildeLOT ϩ 0 000950 TAMANtildeLOT

Pr onos t i cador Coef Des vEs t Coci ent e - t pCons t ant e 6 898 3 737 1 85 0 076TAMANtildeLOT - 0 12010 0 03148 - 3 82 0 001TAMANtildeOSQ 0 00094954 0 00006059 15 67 0 000

s ϭ 2 423 R- s q ϭ 99 5

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 2 34186 17093 2911 35 Er r or 27 159 6Tot al 29 34345

IGURA 13-20

Salida de residuosde Minitab

RENGLOacuteN DEFECTOS AJ UST1 RESI 11 5 4 383 0 617282 10 6 721 3 278693 6 6 721 - 0 721314 7 6 721 0 278695 6 10 247 - 4 246826 7 10 247 - 3 246827 17 14 959 2 040748 15 14 959 0 040749 24 20 859 3 14138

10 21 20 859 0 1413811 22 20 859 1 1413812 26 27 945 - 1 9449113 29 27 945 1 0550914 25 27 945 - 2 9449115 34 36 218 - 2 21811

16 37 36 218 0 7818917 41 36 218 4 7818918 34 36 218 - 2 2181119 49 45 678 3 3217520 53 56 325 - 3 3253021 54 56 325 - 2 3253022 69 68 159 0 8407223 82 81 180 0 8198224 81 81 180 - 0 1801825 84 81 180 2 8198226 92 95 388 - 3 3880027 96 95 388 0 61200

28 97 95 388 1 6120029 109 110 783 - 1 7827530 112 110 783 1 21725

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4156

b) iquestEstaacute satisfecho con el modelo como pronosticador de VENTAS Expliquec) La siguiente salida usa TIEMPO y TIEMPOSCUAD (TIEMPOS al cuadrado) como variab

cativas iquestEs este modelo cuadraacutetico un mejor ajuste para los datos Explique

La ecuacioacuten de regresioacuten es

VENTAS ϭ 13981 Ϫ 8142 TIEMPO ϩ 1326 TIEMPOSCUAD

Pronosticador Coef DesvEst Cociente-t p

Constante 13981 2720 514 0000

TIEMPO Ϫ81415 9619 Ϫ846 0000

TIEMPOSCUAD 132572 7203 1841 0000

s ϭ 2631 R-sq ϭ 996

RENGLOacuteN VENTAS AJUST1 RESI1 RENGLOacuteN VENTAS AJUST1 RESI1

1 4618 7165 Ϫ2547 7 19746 21950 Ϫ2204

2 3741 3001 740 8 34215 33695 520

3 5836 1488 4348 9 50306 48090 2216

4 4367 2626 1741 10 65717 65138 579

5 5118 6416 Ϫ1298 11 86434 84836 1598

6 8887 12858 Ϫ3971 12 105464 107186 Ϫ1722

EA 13-7 La siguiente tabla contiene datos de gastos de consumo CONSUMO ingreso disponible INGsexo de la cabeza de la casa SEXO de 12 familias elegidas al azar La variable GEacuteNERO se hado como sigue

GEacuteNERO ϭ Ά1 si SEXO ϭ M (masculino)0 si SEXO ϭ F (femenino)

Consumo Ingreso (doacutelares) Sexo Geacutenero

37070 45100 M 1

22700 28070 M 1

24260 26080 F 0

30420 35000 M 1

17360 18860 F 0

33520 41270 M 1

26960 32940 M 1

19360 21440 F 035680 44700 M 1

22360 24400 F 0

28640 33620 F 0

39720 46000 M 1

a) Utilice la siguiente salida de Minitab para determinar la regresioacuten de mejor ajuste para prCONSUMO a partir de INGRESO y GEacuteNERO

La ecuacioacuten de regresioacuten es

CONSUMO ϭ 2036 ϩ 0818 INGRESO Ϫ 1664 GEacuteNERO

Pronosticador Coef DesvEst Cociente-t p

Constante 2036 1310 155 0155

INGRESO 081831 004940 1656 0000

GEacuteNERO Ϫ16642 9169 Ϫ182 0103

s ϭ 1015 R-sq ϭ 984

b) Si el ingreso disponible se mantiene constante iquestexiste una diferencia significativa en el contre las casas cuya cabeza es masculina comparada con aqueacutellas cuya cabeza es femenina Elas hipoacutetesis expliacutecitas prueacutebelas para un nivel de 010 y establezca una conclusioacuten expliacuteci

c) Proporcione un intervalo de confianza para la estimacioacuten del 95 para el consumo en unaingreso disponible de $40000 cuya cabeza de familia es masculina

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4256

Conceptos baacutesicos

13-31 Describa tres situaciones de la vida diaria en las que las variables ficticias podriacutean utilizarse ende regresioacuten

13-32 El duentildeo de restaurantes situados en dos ciudades cree que el ingreso se puede predecir a partirde traacutensito frente a los restaurantes con un modelo de regresioacuten cuadraacuteticaa) Describa un modelo cuadraacutetico para predecir el ingreso a partir del flujo de traacutensito Establez

ma de la ecuacioacuten de regresioacutenb) Se ha sugerido que la ciudad en donde se encuentra un restaurante tiene efecto sobre el ing

tienda el modelo del inciso a) con una variable ficticia para incorporar la sugerencia De nueblezca la forma del modelo de regresioacuten

13-33 Suponga que tiene un conjunto de puntos al cual ha ajustado una ecuacioacuten de regresioacuten lineal A R2 para la recta es muy alta usted se pregunta si seraacute buena idea ajustar una ecuacioacuten de seguna los datos Describa coacutemo tomariacutea su decisioacuten basaacutendose ena) Un diagrama de dispersioacuten de los datosb) Una tabla de residuos de la regresioacuten lineal

13-34 Un estadiacutestico recolectoacute un conjunto de 20 pares de datos A la variable independiente la llamoacutevariable dependiente Y Llevoacute a cabo una regresioacuten de Y sobre X 1 y no quedoacute satisfecho con el rDebido a algunos patrones no aleatorios que observoacute en los residuos decidioacute elevar al cuadradores de X 1 designoacute como X 2 a estos valores al cuadrado Luego el estadiacutestico corrioacute una regresioacuteple de Y sobre X 1 y X 2 La ecuacioacuten resultante fue

Y ˆ ϭ 2004 ϩ 279 X 1 ndash 392 X 2

El valor de S b1 fue 3245 y el de S b2 fue 153 A un nivel de significancia de 005 determine sia) el conjunto de valores lineales de X 1 es una variable explicativa significativa para Y b) el conjunto de valores al cuadrado de X 1 es una variable explicativa significativa para Y

Aplicaciones

13-35 La doctora Linda Frazer tiene una cliacutenica en Filadelfia Registroacute los datos de la edad reaccioacuten cilina y presioacuten sanguiacutenea sistoacutelica de 30 pacientes Establecioacute la presioacuten sanguiacutenea como ladependiente la edad como X 1 (variable independiente) y la reaccioacuten a la penicilina como X

ble independiente) Designoacute 0 para una reaccioacuten positiva a la penicilina y 1 para una reaccioacuten realizoacute una regresioacuten muacuteltiple en su computadora La ecuacioacuten de prediccioacuten es

Y ˆ ϭ 67 ϩ 35 X 1 ϩ 0489 X 2

a) Despueacutes de haber corrido la regresioacuten la doctora Frazer descubrioacute que en realidad queriacutea una reaccioacuten positiva a la penicilina como 1 y la negativa como 0 iquestTiene que volver a realigresioacuten Si asiacute es iquestpor queacute Si no deacute la ecuacioacuten que hubiera obtenido de haber codificadoble como en realidad lo deseaba

b) Si S b2 tiene un valor de 009 iquestesta regresioacuten proporciona evidencia a un nivel de significancide que la reaccioacuten a la penicilina es una variable explicativa significativa de la presioacuten sang

13-36 La empresa de computadoras Excelsior Notebook estaacute revisando su poliacutetica de control de inventacesitan predecir con exactitud el nuacutemero de computadoras EXC-11E que ordenaraacuten los provee

las proacuteximas semanas Los datos de las uacuteltimas 15 semanas son los siguientesTiempo Demanda (en miles)

1 67

2 102

3 134

4 156

5 182

6 226

7 305

8 314Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4356

Tiempo Demanda (en miles)

9 387

10 416

11 487

12 514

13 558

14 615

15 689

a) Utilice el paquete de software que tenga para ajustar un modelo lineal con TIEMPO como l

independiente y DEMANDA como la variable dependienteb) Ajuste un modelo cuadraacutetico a los datos iquestEs mejor este modelo Explique 13-37 Los siguientes datos corresponden a las ventas brutas (VENTAS) de la pizzeriacutea local el dinero

tan en promociones (PROMO) y el tipo de promocioacuten que incluye radio perioacutedicos y volantesque la pizzeriacutea usa un solo tipo de promocioacuten en una semana dada Las variables TIPO1 y TIPOcodificado como sigue

TIPO1 ϭ 1 si se usoacute radio 0 de otra manera

TIPO2 ϭ 1 si se usaron volantes 0 de otra manera

(cuando las dos TIPO1 y TIPO2 son 0 el presupuestos de la promocioacuten de esa semana se gastoacutecios de perioacutedico)

VENTAS (cientos) PROMO (cientos) TIPO1 TIPO2

121 38 0 1

191 64 0 1

269 79 0 0

248 87 1 0

371 124 1 0

394 159 0 1

325 113 0 0

289 94 0 0

288 86 1 0

347 127 0 1

384 143 0 0

263 67 1 0

a) Utilice un paquete de software para ajustar un modelo de regresioacuten que pronostique VENTtir de PROMO TIPO1 y TIPO2

b) Establezca la funcioacuten de regresioacuten ajustadac) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre el radio y el p

Establezca las hipoacutetesis adecuadas y pruebe con un nivel de significancia de 005d) Si PROMO se mantiene constante iquestexiste una diferencia significativa entre los volantes y e

co Establezca las hipoacutetesis adecuadas y prueba con un nivel de significancia de 005e) Calcule un intervalo de confianza del 90 para VENTAS en una semana en la que se gasta

usando anuncios de radio como el uacutenico tipo de promocioacuten

Soluciones a los ejercicios de autoevaluacioacutenEA 13-6 De la salida de computadora se obtienen los siguientes resultados

a) Pronoacutestico de VENTAS ϭ Ϫ26233 ϩ 9093TIEMPOb) Aunque R2 es relativamente alta (831) eacuteste no es un buen modelo debido al patroacuten en los

Comienzan grandes y positivos disminuyen van a grandes y negativos y despueacutes crecen ade nuevo Es claro que seriacutea mejor un modelo cuadraacutetico

c) Pronoacutestico de VENTAS ϭ 13981 Ϫ 81415TIEMPO ϩ 132572TIEMPOCUADEste modelo es bastante mejor R2 aumenta a 996 y no hay un patroacuten en los residuos

EA 13-7 De la salida de computadora se tienen los siguientes resultadosa) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818INGRESO Ϫ 1664GEacuteNERO

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4456

b) H0 BGEacuteNERO ϭ 0 H1 BGEacuteNERO 0 ϭ 010Dado que el valor prob para la prueba (0103) es mayor que (010) no se puede rechazar H0 el geacute-nero de la cabeza de familia no es un factor significativo para explicar el consumo

c) Pronoacutestico de CONSUMO ϭ 2036 ϩ 0818(40000) Ϫ 1664(1) ϭ $33092Con 9 grados de libertad el valor t para un intervalo de confianza para Y ˆ del 95 para CONSUMOes 2262 de manera que el intervalo es

Y ˆ Ϯ tse ϭ 33092 Ϯ 2262(1015) ϭ 33092 Ϯ 2296 ϭ ($30796 $35388)

Estadiacutestica en el trabajo

Loveland ComputersCaso 13 Regresioacuten muacuteltiple y modelado Lee estaba felizde poder informar a Nancy Rainwater que los defectos queocurriacutean en las bases de los teclados de hecho se relaciona-ban con las bajas temperaturas diarias registradas en Love-land El supervisor del almaceacuten confirmoacute la explicacioacuten

ldquoSeguro el almaceacuten donde se guardan los componentestiene calefaccioacutenrdquo informoacute Skip Tremont ldquoPero soacutelo se tra-ta de dos calentadores industriales de gas instalados cerca deltecho Cuando el ambiente empieza a enfriar un poco fun-

cionan bastante bien Pero en esas noches de invierno verda-deramente friacuteas aunque los calentadores trabajen toda la no-che el almaceacuten sigue muy friacuteordquo

ldquoiquestAsiacute que necesitamos maacutes calentadoresrdquo preguntoacuteNancy

ldquoNo necesariamente el problema es que todo el aire ca-liente se queda en la parte de arriba y enfriacutea bastante cercadel suelo Entonces cuando la gente empieza a entrar y salirdurante el tiempo de trabajo el aire se revuelve y el nivel in-ferior en donde se almacenan las cosas queda a temperatu-ra ambienterdquo

ldquoDe modo que podriacuteamos resolver el problema instalandoun par de ventiladores en el techordquo intervino Tyrona Wilson

ldquoJusto lo que estaba pensandordquo dijo Skip al tiempo quese metiacutea a su camioneta para ir a la tienda de materiales parala construccioacuten ldquoNo son caros puedo comprar un par con eldinero de mi presupuesto de mantenimientordquo

ldquoiexclUn gran ejemplo de administracioacuten de calidadrdquo co-mentoacute Lee ldquoVes Nancy las personas que trabajan en el ca-da aacuterea saben las respuestas soacutelo tienes que facultarlos paraque implanten una solucioacutenrdquo

ldquoBueno deacutejame invitarte a comer para que platiques conalguien que tiene un problema maacutes complicadordquo

Frente a un plato de tamales Lee Azko conocioacute a SherrelWright la gerente de publicidad Sherrel era una ldquonueva con-tratacioacutenrdquo y soacutelo teniacutea seis meses en la compantildeiacutea ldquoYa cono-

ces a Margot estaacute a cargo de marketing Ella maneja el pa-norama completo Mi trabajo consiste en concentrarme en elpresupuesto de publicidad y colocar anuncios de modo queel resultado el mayor aumento posible en las ventasrdquo

ldquoiquestCoacutemo decides cuaacutento de cada medio contratarrdquo pre-guntoacute Lee

ldquoPara ser sincera antes de que yo llegara las cosas no sehaciacutean de manera muy cientiacutefica Tu tiacuteo te diraacute que cuandoLoveland empezoacute el nuacutemero de anuncios dependiacutea del flujode efectivo Cuando entreacute a trabajar aquiacute pude ver que el pre-supuesto de publicidad subiacutea y bajaba seguacuten el dinero obte-nido el trimestre anterior Esto significaba que si teniacuteamos untrimestre malo la compantildeiacutea disminuiacutea el presupuesto de pu-blicidad del siguiente Margot les deciacutea todo el tiempo queeso era justo lo contrario a una buena estrategia en muchasocasiones el aumento del presupuesto de publicidad te pue-de sacar de una depresioacuten en ventas Pero me imagino quesiempre sentiacutean paacutenico respecto al flujo de efectivo Ahoraparece que vamos a tener un nuevo presupuesto sustancial y

tendremos que ser maacutes cientiacuteficos en cuanto a nuestros pla-nes de publicidadrdquoldquoEntonces iquestcoacutemo decides queacute anuncios comprarrdquo Lee

estaba ansioso por saber maacutes de comercializacioacuten en el mun-do real

ldquoBueno tu tiacuteo dice que es un arte Eacutel tendiacutea a contratar pu-blicidad con las revistas que le gusta leer aunque es el pri-mero en admitir que no seriacutea un tiacutepico cliente de Lovelandde manera que ha sido bastante receptivo con mis ideas delcosto por miles de lectores lectores meta etc Las revistasmensuales de computacioacuten son nuestro objetivo principalpero cada mes salen al mercado maacutes de modo que tengoque ser selectiva al ver doacutende gastamos el dinero Algunos

de nuestros competidores han estado comprando espacios decuatro o cinco paacuteginas Hemos intentado hacer eso en un parde revistas pero resulta difiacutecil saber si tienen mayor rendi-miento que el anuncio de una paacutegina El volumen de ventastiende a atrasarse respecto a la publicidad efectiva es difiacutecilmedir el eacutexito de un anuncio individual

ldquoSupongo que ya intentaron monitorear el volumen dellamadas a los nuacutemeros 800rdquo comentoacute Lee

ldquoPues no Seriacutea buena idea iquesttenemos estadiacutesticas de esordquoldquoAunque no las tengamos la compantildeiacutea de teleacutefonos pue-

de darnos un informe diario Tenemos que ver si el volumen dellamadas o el volumen de ventas es el mejor indicadorrdquo ex-presoacute Lee muy en su papel

ldquoOye no es tan sencillordquo intervino Gracia Delaguardiala ingeniera en jefe de la compantildeiacutea que acababa de llegar conun plato de burritos en la mano y jalaba una silla ldquoiquestNo im-porta si me sientordquo

ldquoAdelanterdquo dijo Sherrel quien no teniacutea la intencioacuten decortar a uno de los dos socios de Loveland Computers

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4556

ldquoSin aacutenimo de ofender tu sensibilidad de pubicista creoque fuerzas externas a la compantildeiacutea determinan nuestras ven-tas Si la economiacutea crece nos va bien si hay recesioacuten no nosva tan bienrdquo

ldquoiquestEn los primeros antildeos de la empresa ocurrioacute asiacuterdquo pre-guntoacute Lee ldquoParece que tuvieron un crecimiento espectaculardurante tiempos difiacuteciles al inicio de los ochentardquo

ldquoY lo que haga la competencia es crucialrdquo antildeadioacute Graciaignorando el comentario de Lee ldquoPuedes verificarlo Miralos nuacutemeros atrasados de las revistas de computacioacuten y notaraacutes

cuaacutentas paacuteginas de anuncios compraban ldquoen comparacioacutenrdquocon nosotros Y tambieacuten puedes ver sus precios relativos a losnuestros para maacutequinas equivalentes Estaacute impreso en cadaanunciordquo

Lee hizo una nota mental de que iba a ser mucho maacutes faacute-cil que en otras industrias en las que los precios de los com-petidores podiacutean quedar ocultos en contratos de largo plazo

ldquoiquestY cuaacutento rinden nuestros anuncios en los perioacutedicosSherrel se preguntoacute en voz alta ldquoNos cuesta mucho sacpublicidad en el The Wall Street Journal pero tengo la ssacioacuten de que nos da un resultado inmediatordquo

ldquoPensemos juntos en esto y hagamos un plan para ver cmo lo resolvemosrdquo propuso Lee al tiempo que le haciacutea ntildeas a la mesera para que les llevara maacutes salsa picante

Preguntas de estudio iquestQueacute medida de ldquoeacutexito de publidadrdquo investigariacutea usted iquestQueacute factores considerariacutea en anaacutelisis iquestDe queacute manera manejariacutea los factores que parecirrelevantes Ademaacutes del repaso de los datos histoacutericiquestexiste alguacuten otro ldquoexperimentordquo que usted recomendariacutea

HH IndustriesAl diacutea siguiente Laurel explicoacute lo que encontroacute a Gary ldquoLaedad muy bien puede tener su papelrdquo concluyoacute ldquopero defi-nitivamente no es el uacutenico factor iquestTienes alguna otra ideardquo

ldquoNo seacute cuaacutento nos podriacutean ayudar pero tengo un par desu gerenciasrdquo respondioacute Gary ldquoEn primer lugar el geacuteneropuede ser algo que ver Sin tener datos especiacuteficos para apo-yar mi presentimiento me parece que las mujeres que traba-

jan tienden a quedarse maacutes tiempo que los hombres Ademaacutesel grado de escolaridad puede ser otro factor Los compantildee-ros que tienden a quedarse con nosotros parece suelen serlos que no tienen un grado universitario que les tiente a ha-cer cosas mejores y maacutes grandes iquestSuena razonablerdquo

ldquoAmbas ideas son buenasrdquo asintioacute Laurel y se puso a rabatear algunas notas ldquoiexclTe hareacute saber si se me ocurre algo

1 Utilice los archivos CH12xxx del CD que acompantildea albro para hacer una regresioacuten simple de la antiguumledad el trabajo contra el geacutenero (use 1 para masculino 0 pfemenino) iquestCuaacuteles son los coeficientes de determinaciy correlacioacuten Repita el anaacutelisis para la antiguumledad cotra antildeos de escolaridad

2 Ahora realice una regresioacuten muacuteltiple utilizando las tvariables independientes (edad al tiempo de la contracioacuten geacutenero y grado de escolaridad) iquestEs esta ecuacmejor o peor que las regresiones simples

3 Si tuviera que escoger solamente dos factores explicavos iquestcuaacuteles parecen ser los maacutes apropiados (Utilice

valores prob si estaacuten disponibles) Corra esta regresmuacuteltiple y compaacuterela con la regresioacuten de tres variables

Ejercicio de base de datos

computacional

Administracioacuten de las partesreparables en American AirlinesPara apoyar a su flota de aproximadamente 400 avionesAmerican Airlines mantiene un inventario disponible de par-tes reparables Este inventario contiene maacutes de 5000 tiposdiferentes de unidades que variacutean en precio desde varios

cientos hasta maacutes de 500000 doacutelares Un sistema de apopara la toma de decisiones basado en una PC el SistemaAsignacioacuten y Planeacioacuten de Reemplazables (RAPS Ro

bles Allocation and Planning System) fue desarrollado pproporcionar pronoacutesticos de demanda de partes reemplaz

bles y recomendar asignaciones de partes a aeropuertosmiacutenimo costo El sistema utiliza regresioacuten lineal para pnosticar y otros meacutetodos estadiacutesticos para determinar demadas esperadas y asignaciones de costo Los resultadosahorro inicial de siete millones de doacutelares y ahorros recurretes anuales de casi 1 milloacuten de doacutelares

Del libro de textoal mundo real

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4656

Problemas de negocios y datos Antes de partir se espe-ra que el complemento completo de partes de un avioacuten esteacuteen perfectas condiciones de operacioacuten Si una parte reempla-zable estaacute defectuosa seraacute removida e idealmente se sustitui-raacute por otra en servicio proveniente del almaceacuten La piezadefectuosa se enviacutea a reparacioacuten y se ordena otra pieza quefunciona para el almaceacuten Uno de los deberes del Departa-mento de Administracioacuten de Materiales de American Airli-nes consiste en distribuir partes a los almacenes de unamanera efectiva en costos equilibrando el costo de tener la

parte y el costo del faltante en el almaceacuten al tiempo quemantiene un nivel aceptable de disponibilidad El problemaconsiste en encontrar un meacutetodo de asignacioacuten que propor-cione el menor costo total

Desarrollo de RAPS La empresa veniacutea usando un Sistemade Pronoacutesticos y Control de Disponibilidad de Reempla-zables (ROFACS Rotables Forecasting and Availability

Control System) basado en la metodologiacutea de las series detiempo para apoyar la toma de decisiones sobre la distribu-cioacuten de partes reparables ROFACS era un indicador valiosode niveles de asignacioacuten apropiados pero los departamentosde Tecnologiacuteas de Decisioacuten y Administracioacuten de Materiales

reconocieron que habiacutea deficiencias en el sistema El anaacuteli-sis de sensibilidad era difiacutecil y llevaba mucho tiempo noexistiacutea documentacioacuten del sistema y se pensaba que algunosde los elementos de datos criacuteticos eran imprecisos Ade-maacutes los pronoacutesticos teniacutean una respuesta lenta a cambiosmoderados en el uso de aviones y la expansioacuten de la flotaTecnologiacuteas de Decisioacuten desarrolloacute el RAPS con la apro-bacioacuten cooperacioacuten y participacioacuten del Departamento deAdministracioacuten de Materiales El objetivo de RAPS es reco-mendar asignaciones de partes disponibles y ayudar a losadministradores de inventario a analizar el control de partesreemplazables

Pronoacutesticos El resultado final de una corrida de RAPS esuna asignacioacuten de partes reemplazables con un costo miacuteni-mo derivada de un proceso de pronoacutesticos de dos etapas1) caacutelculo de la demanda total del sistema para la parte y2) distribucioacuten de la demanda entre los almacenes individua-les Para calcular la demanda total esperada del sistemaRAPS utiliza una regresioacuten lineal para establecer una rela-cioacuten entre las partes reemplazadas por mes y las distintas

funciones en horas de vuelo mensuales El sistema actualizahistorias de 18 meses de reemplazos y horas de vuelo pormes Despueacutes un moacutedulo calcula los coeficientes correspon-dientes a la mejor regresioacuten y examina muchos pronoacutesticosposibles basaacutendose en las horas de vuelo o en funciones delas horas de vuelo Las evaluaciones de las regresiones se ba-san en ajustes y en la significacioacuten estadiacutestica El proceso degeneracioacuten mensual de pronoacutesticos de demandas para maacutes de5000 partes utilizando regresioacuten estaacute completamente auto-matizado Antes de RAPS se necesitaban diacuteas para producir

los pronoacutesticos y verificar su precisioacuten actualmente tomasoacutelo unas cuantas horas Para distribuir la demanda del siste-ma entre los almacenes individuales RAPS asigna un peso acada almaceacuten que refleja su actividad esperada con base enlos datos recolectados de los horarios de vuelos y el mante-nimiento Una vez establecida la demanda real el costo totalde la asignacioacuten puede determinarse fijando valores a loscostos de inventario y a los costos esperados por faltantesJuntos los moacutedulos de RAPS permiten al personal del depar-tamento de administracioacuten de materiales tomar decisionesinformadas acerca del nuacutemero y localizacioacuten de las partes re-queridas y examinar las consecuencias de los cambios en lassuposiciones de asignacioacuten baacutesicas

Beneficios En teacuterminos estrictamente econoacutemicos RAPSfue un gran eacutexito pues produjo ahorros multimillonarios endoacutelares pero tambieacuten proporcionoacute beneficios indirectosRAPS aumentoacute la productividad de los analistas permitieacuten-doles analizar muchas maacutes partes en un solo diacutea Tambieacutenproporcionoacute un registro de auditoriacuteas con fechas y horas delos anaacutelisis de partes Debido a que el proceso fue simplifi-cado el tiempo entre anaacutelisis de la misma pieza se acortoacute locual significa que las asignaciones se basan en datos maacutes ac-tuales Por uacuteltimo el uso de regresiones en RAPS ha aumen-tado la visioacuten de los analistas respecto a la sensibilidad deuna asignacioacuten a todos los paraacutemetros de entrada ya sea de ma-nera independiente o en combinacioacuten La amplia capacidadde anaacutelisis de sensibilidad de RAPS creoacute un sistema maacutesorientado hacia el futuro capaz de analizar condiciones ycomportamientos cambiantes

Fuente Mark J Tedone ldquoRepairable Part Managementrdquo Interfaces 19(4) (julio-agosto de 1989) 61-68

Repaso del capiacutetulo Teacuterminos introducidos en el capiacutetulo 13

Anaacutelisis de varianza para regresioacuten Procedimiento paracalcular el cociente F utilizado para probar la significanciade la regresioacuten como un todo Estaacute relacionado con el anaacuteli-sis de varianza ilustrado en el capiacutetulo 11

Cociente R calculado Estadiacutestico que se utiliza para probarla significancia de la regresioacuten como un todo

Coeficiente de correlacioacuten muacuteltiple R Raiacutez cuadrada po-sitiva de R

2

Coeficiente de determinacioacuten muacuteltiple R2 Fraccioacuten de lavariacioacuten de la variable dependiente que explica la regre-sioacuten R2 mide queacute tan bien la regresioacuten muacuteltiple se ajusta alos datos

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4756

Error estaacutendar de un coeficiente de regresioacuten Medida denuestra incertidumbre acerca del valor exacto del coeficien-te de regresioacuten

Multicolinealidad Problema estadiacutestico que a veces se pre-senta en el anaacutelisis de regresioacuten muacuteltiple en el que se reducela confiabilidad de los coeficientes de regresioacuten debido a unalto nivel de correlacioacuten entre las variables independientes

Regresioacuten muacuteltiple Proceso estadiacutestico mediante el cual seutilizan varias variables para predecir otra variable

t calculada Estadiacutestico que se utiliza para probar la signifi-cancia de una variable explicativa individual

Teacutecnicas de modelado Meacutetodos para decidir queacute incluir en un modelo de regresioacuten y las diferentesde incluirlas

Transformaciones Manipulaciones matemaacuteticas vertir una variable a una forma diferente de modo qmos ajustar curvas o rectas mediante la regresioacuten

Variable ficticia Variable que toma valores 0 o 1 ymite incluir en un modelo de regresioacuten factores cucomo sexo estado civil y grado de escolaridad

Ecuaciones introducidas en el capiacutetulo 13

13-1 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2

En regresioacuten muacuteltiple eacutesta es la foacutermula de la ecuacioacuten de estimacioacuten que describe la relacioacuten variables Y X 1 y X 2 Representa una regresioacuten muacuteltiple de dos variables con un plano en lugrecta

13-2 Y ϭ na ϩ b1 X 1 ϩ b2 X 2

13-3 X 1Y ϭ a X 1 ϩ b1 X 21 ϩ b2 X 1 X 2

13-4 X 2Y ϭ a X 2 ϩ b1 X 1 X 2 ϩ b2 X 22

Resolver estas tres ecuaciones determina los valores de las constantes numeacutericas a b1 y b2 ycuencia el plano de regresioacuten muacuteltiple de mejor ajuste de una regresioacuten muacuteltiple de dos variab

13-5 Y ˆ ϭ a ϩ b1 X 1 ϩ b2 X 2 ϩ ϩ bk X k

Eacutesta es la foacutermula para la ecuacioacuten de estimacioacuten que describe la relacioacuten entre Y y las k variabpendientes X 1 X 2 X k La ecuacioacuten 13-1 es el caso especial de esta ecuacioacuten para k ϭ 2

13-6 se ϭ

Ί

Para medir la variacioacuten alrededor de una ecuacioacuten de regresioacuten muacuteltiple cuando hay k variablesdientes utilice esta ecuacioacuten para encontrar el error estaacutendar de la estimacioacuten El error estaacutendacaso tiene n Ϫ k Ϫ 1 grados de libertad debido a las k ϩ 1 constantes numeacutericas que deben capartir de los datos (a b1 bk )

13-7 Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k

Eacutesta es la ecuacioacuten de regresioacuten de la poblacioacuten para la regresioacuten muacuteltiple Su ordenada Y es A

coeficientes de pendiente uno para cada una de las variables independientes

13-7a Y ϭ A ϩ B1 X 1 ϩ B2 X 2 ϩ ϩ Bk X k ϩ e

Debido a que no todos los puntos individuales de una poblacioacuten estaacuten en la ecuacioacuten de regres

poblacioacuten los puntos individuales satisfaraacuten esta ecuacioacuten donde e es una variacioacuten aleatoria dcioacuten de regresioacuten de la poblacioacuten En promedio e es igual a cero debido a que las variaciones arriba de la ecuacioacuten de regresioacuten se cancelan con las que se encuentran abajo de ella

13-8 t ϭ

Una vez encontrado el valor de sbi en la salida de computadora podemos utilizar esta ecuacioacutentandarizar el valor observado del coeficiente de regresioacuten Luego probamos las hipoacutetesis acerca diante la comparacioacuten de este valor estandarizado con el o los valores criacuteticos de t con n Ϫ k Ϫ

de libertad tomados de la tabla 2 del apeacutendice

b1 Ϫ Bi0ᎏ

sbi

(Y Ϫ Y ˆ )2ᎏᎏ

n ndash k Ϫ 1

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4856

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 4956

Desde luego usted estaacute bastante complacido con estos resultados porque el valor R2 es muyro el juez no estaacute convencido de que tenga razoacuten Eacutel dice ldquoiexcleacuteste es el peor trabajo que he vistimporta si esta recta se ajusta a los datos que le di iexclLe puedo decir nada maacutes de ver el resultadpuede funcionar para otros datos Si no puede hacer algo mejor iexcldiacutegamelo para contratar a unco inteligenterdquoa) iquestPor queacute estaraacute el juez tan enojado con los resultadosb) Sugiera un mejor modelo que tranquilice al juez

13-39 Jon Grant supervisor de la Carven Manufacturing Facility estaacute examinando la relacioacuten existencalificacioacuten que obtiene un empleado en una prueba de aptitud su experiencia previa y el eacutexitobajo Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y se obtieneficacioacuten entre 2 y 12 La medida del eacutexito en el empleo se basa en un sistema de puntuacioacuten qu

produccioacuten total y eficiencia con un valor maacuteximo posible de 50 Grant tomoacute una muestra depleados con menos de un antildeo de antiguumledad y obtuvo lo siguiente

X 1 X 2 Y

Resultado de la Experiencia en Evaluacioacuten delprueba de aptitud trabajos anteriores desempentildeo

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

a) Desarrolle la ecuacioacuten de estimacioacuten que mejor describa estos datosb) Si un empleado obtuvo 83 puntos en la prueba de aptitud y teniacutea una experiencia en trabajores de 7 iquestqueacute evaluacioacuten de desempentildeo puede esperar

13-40 La venta exitosa es tanto un arte como una ciencia pero muchos gerentes de ventas piensan qubutos personales son importantes para pronosticar el eacutexito en esa actividad Design Alley es unadisentildeo de interiores con servicio completo que vende persianas alfombras y papel tapiz a la mgerente de la tienda Dee Dempsey contratoacute a una compantildeiacutea de seleccioacuten de personal para realbas de cuatro aptitudes antes de contratar Dee recolectoacute los datos de crecimiento en ventas de 2que contratoacute junto con las calificaciones de las cuatro pruebas de aptitud creatividad habilidapensamiento abstracto y caacutelculo matemaacutetico Por medio de una PC Dee generoacute la siguiente salinitab

RENGLOacuteN DANtildeOS AJUSTl RESI l1 0 645 0 1117 0 533332 0 750 0 6296 0 120423 1 000 1 1475 - 0 147504 1 300 1 6654 - 0 365425 1 750 2 1833 - 0 433336 2 205 2 7013 - 0 496257 3 500 3 2192 0 280838 4 000 3 7371 0 262929 4 500 4 2550 0 24500

La ec uaci oacuten de r egr es i oacuten es CRECI MI ENTO = 70 1 + 0 422 CREAT + 0 271 MOTR + 0 745 ABST = 0 420 MATE

Pr onos t i cador Coef Des vEs t Coci ent e- t pCons t ant e 70 066 2 130 32 89 0 000CREAT 0 42160 0 17192 2 45 0 024MOTR 0 27140 0 21840 1 24 0 228ABST 0 74504 0 28982 2 57 0 018MATE 0 41955 0 06871 6 11 0 000

s ϭ 2 048 R- s q ϭ 92 6

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5056

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5156

13-46 El doctor Harden Ricci es un veterinario que vive en Sacramento California Recientemente hdo desarrollar una ecuacioacuten de prediccioacuten para la cantidad de anestesia (medida en mililitros) utilizar en las operaciones Siente que la cantidad utilizada dependeraacute del peso del animal (en duracioacuten de la operacioacuten (en horas) y si el animal es un gato (codificado como 0) o un perro (ccomo l) Usoacute Minitab para correr una regresioacuten de los datos de 13 operaciones recientes y obtuguientes resultados

La ec uaci oacuten de r egr es i oacuten esANESTESI A ϭ 90 0 ϩ 99 5 TI PO ϩ 21 5 PESOϪ 34 5 HORAS

Pr onos t i cador Coef Des vEs t Coci ent e - t p

Cons t ant e 90 032 56 842 1 58 0 148TI PO 99 486 42 374 2 35 0 044PESO 21 536 2 668 8 07 0 000HORAS - 34 461 28 607 - 1 21 0 259

s ϭ 57 070 R- s q ϭ 95 3

Anaacutel i s i s de var i anz a

FUENTE GL SC MC F Regr es i oacuten 3 590880 196960 60 47 Er r or 9 29312 3256 9Tot al 12 620192

a) iquestCuaacutel es la ecuacioacuten de prediccioacuten obtenida con Minitab para la cantidad de anestesiab) Deacute un intervalo de confianza aproximado del 95 para la cantidad de anestesia que deberaacute u

una operacioacuten de 90 minutos de duracioacuten en un perro que pesa 25 librasc) A un nivel de significancia del 10 iquestes la cantidad de anestesia necesaria significativament

te para perros y gatosd) A un nivel de significancia del 5 iquestes esta regresioacuten significativa como un todo

13-47 David Ichikawa es un agente de bienes raiacuteces que trabaja con urbanistas que construyen casaAunque gran parte de su trabajo es vender las casas terminadas tambieacuten consulta con los concuaacutento deben pagar por cada lote En un aacuterea residencial recolectoacute la siguiente informacioacuten de vrradas de lotes aptos para construir registroacute PRECIO de venta (en miles de doacutelares) TAMAlineales de frente en la calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA De lasimpuestos puede estimar el aacuterea del lote a partir de un avaluacuteo basada en el frente

PRECIO TAMANtildeO AacuteREA (ϭ TAMANtildeO2) VISTA

562 175 30625 1

425 125 15625 1

675 200 40000 1

390 115 13225 1

333 125 15625 0

290 100 10000 0

300 108 11664 0

480 170 28900 0

443 160 25600 0

a) Use Minitab para desarrollar la recta de regresioacuten de mejor ajuste para estos datosb) iquestQueacute fraccioacuten de la variacioacuten de PRECIO explica esta ecuacioacutenc) Encuentre un intervalo de confianza del 90 para el incremento en el valor de mercado at

tener una VISTAd) iquestAyudoacute utilizar AacuteREA (el cuadrado del TAMANtildeO) en la regresioacuten Explique su respuesta

13-48 Camping-R-Us un fabricante nuevo de equipo para acampar planea comercializar tiendas depara dos personas que se pueden utilizar en casi cualquier clima Para establecer un precio justoconsideracioacuten ocho tiendas de campantildea comparables que se encuentran en el mercado en teacuterminso y superficie Los datos obtenidos son los siguientes

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5256

Peso (onzas) Superficie (pies cuadrados) Precio

Kelty Nautilus 94 37 $225

Nort Face Salamander 90 36 240

U Mountain Hut 112 35 225

Sierra Designs Meteor light 92 40 220

Eureka Cirrus 3 93 48 167

Sierra Designs Clip 3 98 40 212

Eureka Timberline Deluxe 114 40 217

Diamond Brand Free Spirit 108 35 200

a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir del peso y la supeb) Si la tienda de Camping-R-Us pesa 100 onzas y tiene una superficie de 46 pies cuadrados iquesta

cio debe venderla 13-49 La Asociacioacuten de Atletismo de Carolina estaacute interesada en organizar el primer triatloacuten anual de

Para atraer a atletas de alto nivel la asociacioacuten desea ofrecer premios en efectivo a los primerosestableciendo tiempos para los ganadores globales de la competencia hombres y mujeres trayecto no se ha recorrido antes la asociacioacuten ha escogido 10 carreras de diferentes longitudessidera comparables en clima y condiciones del recorrido

Tiempo de ganadorMillas (HrMinSeg)

Triatloacuten Nado Ciclismo Carrera Hombres Muj

Bud light Ironman 24 112 262 80915 90

Worldrsquos Toughest 20 100 186 82509 94

Muncie Endurathon 12 553 131 40530 44

Texas Hill Country 15 48 100 32424 35

Leonrsquos QEM 093 248 62 15432 20

Sacramento International 093 248 62 14816 20

Malibu 050 18 50 11925 13

Bud Light Endurance 24 112 262 92630 110

Wendyrsquos 05 20 40 11459 12

MammothSnowcreek 06 25 62 15607 21

a) Determine las ecuaciones de regresioacuten para predecir los tiempos de hombres y mujeres ganateacuterminos de la longitud de cada etapa individual (Convierta los tiempos en minutos para los c

b) Prediga los tiempos de ganadores si el triatloacuten de Tarheel comprende 1 milla de nado 50 milcorrido en bicicleta y 125 millas de carrera

c) Si la asociacioacuten desea utilizar el liacutemite inferior de un intervalo de confianza aproximado delra los tiempos de los primeros lugares para hombres y mujeres iquestcuaacuteles seraacuten esos tiempos

La tabla MR13-1 contiene informacioacuten financiera acerca de las 28 compantildeiacuteas maacutes grandes de del Norte con acciones en la bolsa Las variables de la tabla son

NOMBRE Nombre de la compantildeiacutea

PRECIO Precio de cierre de una accioacuten en la bolsa de valores el 4193

DIV Dividendo pagados por accioacuten en 1992

GPA Ganancias por accioacuten en 1992VENTAS Porcentaje de cambio en las ventas totales en 1992

INGRESOS Porcentaje de cambio en los ingresos netos de 1992

ACTIVOS Porcentaje de cambio en activos en 1992

PREANTE Precio de cierre de una accioacuten el 123191

NY 1 si las accones se negocian en la Bolsa de Valores de Nueva York 0 en otro caso

BANCO 1 si la compantildeiacutea es un banco o institucioacuten de creacutedito 0 en otro caso

Utilice esta informacioacuten para resolver los ejercicios 13-50 a 13-5313-50 Use las variables DIV GPA VENTAS INGRESOS ACTIVOS y PREANTE como variab

cativas de una regresioacuten para explicar la variacioacuten en PRECIO iquestQueacute fraccioacuten de la variacioacuten exte modelo

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5356

13-51 Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significcluso para ϭ 030 Elimine estas variables y corra otra regresioacuten utilizando solamente las tres

iquestCuaacutento menos de la variacioacuten en PREC 10 se explica con este modelo13-52 Ahora agregue las variables NY y BANCO como variables explicativas Para ϭ 010 iquestexiste

de que si los demaacutes factores permanecen igual estar en la lista de la Bolsa de Valores de Nuevane un efecto significativo sobre PRECIO Para ϭ 010 iquestlos precios de las acciones de banctuciones de creacutedito difieren significativamente de los precios de otras compantildeiacuteas del grupo

13-53 Use el modelo del ejercicio 13-51a)iquestPuede usted llegar a la conclusioacuten al nivel ϭ 005 de que un aumento en los dividend

ce a una disminucioacuten significativa en el precio de las acciones Establezca y pruebe las adecuadas

b) Si lo demaacutes se deja igual iquestel incremento de $1 en la ganancia por accioacuten lleva a un aumento cio de las acciones en una cantidad significativamente mayor que $2 Establezca y pruebe lasis adecuadas para ϭ 005

c) Encuentre un intervalo de confianza del 98 para el cambio en el precio de la accioacuten parapor cada $1 de aumento en el precio por accioacuten el 123191d) El National Bank tiene DIV ϭ 151 GPA ϭ 452 y PREANTE ϭ 4063 iquestQueacute precio de ac

dice el modelo para el 4193 iquestCuaacutel es la comparacioacuten entre la prediccioacuten y el precio por acdadero de $5488 que tuvo el National Bank ese diacutea

13-54 La ciudad de Peoria Illinois se encuentra reestructurando su sistema de impuestos Se investciudades de tamantildeo y estructura econoacutemica parecidos en cuanto a impuestos especiacuteficoss y el intal de impuestos asociadoa) Utilice los datos siguientes para determinar la ecuacioacuten de miacutenimos cuadrados que relacione

so con las tres tasas de impuestos

Datos financieros paracompantildeiacuteas de Carolinadel Norte

Tabla MR13-1 NOMBRE PRECIO DIV GPA VENTAS INGRESOS ACTIVOS PREANTE NY

Duke Power 3950 176 221 38 Ϫ146 32 3500 1

First Union 4750 128 372 14 697 114 3000 1

Wachovia 3650 100 248 Ϫ157 887 06 2900 1

Carolina Power amp Light 3300 158 236 30 40 26 2700 1

Nucor 9125 028 183 105 224 261 4475 1

Food Lion 700 011 037 118 Ϫ132 249 1825 0

Jefferson-Pilot 5500 130 399 25 157 63 3775 1

Unifi 3388 040 104 134 69 647 2238 1

Family Dollar Stores 1850 025 100 171 383 197 1725 1 BBampT Financial 3413 091 275 Ϫ33 264 74 2200 0

lance 2363 092 125 26 38 44 2175 0

Cato 3050 008 103 245 947 542 1450 0

Piedmont Natural Gas 2200 091 140 117 718 87 1675 1

Southern National 2188 050 173 60 480 233 1388 1

First Citizens Bancshares 5300 053 545 Ϫ75 774 Ϫ10 2750 0

Ruddick 2138 039 130 62 149 88 1525 1

United Dominion Inclustries 1313 020 061 267 Ϫ126 164 913 1

Centura Banks 2388 063 166 Ϫ66 1823 101 1275 1

Guilford Milis 2613 057 173 163 562 91 2225 1

CC13 Financiaiexcl 4050 114 310 Ϫ90 180 71 2863 0

United Carolina Bancshares 2250 066 201 Ϫ96 217 71 1588 0

Coastal Healthcare Group 2100 000 085 304 430 517 2775 0

Public Service of NC 1725 075 109 244 589 81 1188 0

Oakwood Homes 2025 006 090 424 580 253 1063 1

NC Natural Gas 2663 098 179 189 383 230 1638 1

Bank of Granite 3000 038 165 Ϫ97 133 79 1963 0

PCA International 1625 028 089 80 56 514 1488 0

Ingles Markets 625 022 031 21 Ϫ488 20 613 0

Fuente Business North Caroline (mayo de 1993) 34-37

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5456

Tasas deimpuestos Ingreso por imp

Propiedad Ventas Gasolina (miles de doacutelares)

1639 2021 3300centgal $2886751686 1972 3300 2885021639 2041 3300 2901151639 2363 0131 2880651639 2200 2540 2882171639 2201 1560 2877461654 2363 0000 288032

2643 1000 3300 2868572584 1091 2998 286718

2048 1752 1826 286710

2176 1648 1555 286274

1925 1991 0757 286707

b) Se tienen dos propuestas para Peoria Estime los ingresos totales de impuestos si las tasas s

Propiedad Ventas Gasolina

Proposicioacuten A 2763 1000 10centgal

Proposicioacuten B 1639 2021 33

Determine cuaacutel propuesta debe adoptar la ciudad

13-55 La cooperativa National Cranberry una organizacioacuten formada por cultivadores de araacutendanos qudica a procesar y comercializar su producto estaacute tratando de establecer una relacioacuten entre el premedio por barril recibido en cualquier antildeo dado y el nuacutemero total de barriles vendidos el antildeo a(dividido en ventas del producto fresco y del producto para procesar)a) Calcule la ecuacioacuten de miacutenimos cuadrados para predecir el precio a partir de las siguientes

Ventas Ventas(en cientos Precios (en cientos Preciosde barriles) del antildeo de barriles) del antildeo

Fresco Para proceso anterior Fresco Para proceso anterior

844 256 1550 320 60 979

965 335 1715 528 860 1090

470 672 1171 340 761 1588

b) Prediga el precio por barril para el siguiente antildeo si las ventas de eacuteste son 980 (fresco) y 360 (ceso)

13-56 Los teleacutefonos celulares fueron introducidos en Europa en 1980 y desde entonces su crecimienpularidad ha sido algo fenomenal El nuacutemero de suscriptores en los antildeos siguientes estaacute contenisiguiente tabla

1981 3510 1984 143300 1987 877850

1982 34520 1985 288420 1988 1471200

1983 80180 1986 507930 1989 2342080

Utilizando el nuacutemero de antildeos desde la introduccioacuten de teleacutefonos celulares como la variable indete (es decir 1981 ϭ 1 etc) encuentre la ecuacioacuten lineal de miacutenimos cuadrados que relaciona a variables Observe los residuos iquestsiguen un patroacuten notorio Encuentre la ecuacioacuten cuadraacutetica de cuadrados iquestCuaacutel parece ser un mejor ajuste

13-57 Mientras se encontraba de compras buscando una nueva bolsa para dormir Fred Montana sintioacutedad acerca de queacute caracteriacutesticas de una bolsa para dormir son maacutes importantes para determinar sFred tomoacute seis bolsas para dormir de Gore-Tex y realizoacute un anaacutelisis de regresioacuten lineal para averi

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Swallow 140 200 55 Ϫ20 255

Snow Bunting 180 225 65 Ϫ10 285

Puffin 240 313 65 Ϫ10 329

Continuacutea

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5556

Relleno Peso total Grueso del aislante Condiciones de Precio(onzas) (libras) (pulg) temp (degF) (doacutelares)

Widgeon 255 325 75 Ϫ10 395

Tern 325 363 90 Ϫ30 459

Snow Goose 410 425 100 Ϫ40 509

a) Haga una regresioacuten del precio sobre el relleno de plumas peso total grueso del aislante y cnes de temperatura Utilizando los valores prob determine cuaacuteles de estas variables son signal nivel ϭ 001

b) iquestQueacute sucede con la regresioacuten como un todo Use el valor prob de ANOVA de nuevo para

para determinar si la regresioacuten como un todo es significativac) iquestQueacute problema podriacutea surgir si se usan todas estas variables juntas iquestLas respuestas a los iy b) parecen indicar que este problema podriacutea estar presente

13-58 Home Depot es una cadena en crecimiento de centros de descuento en materiales para mejorar lLa tabla proporciona informacioacuten de los reportes anuales que son los datos tiacutepicos que usan losfinancieros para predecir el ingreso futuro de la compantildeiacuteaa) Desarrolle la ecuacioacuten de regresioacuten muacuteltiple que describa el ingreso total como funcioacuten de

de tiendas y el tamantildeo promedio de la tienda iquestQueacute factor parece ser maacutes importantes para nar el crecimiento en los ingresos Como consultor iquestrecomendariacutea una estrategia de expanscada a una dispersioacuten geograacutefica amplia (aumentando el nuacutemero de tiendas) o la construccinuacutemero menor de tiendas muy grandes (que aumenta el tamantildeo de las tiendas)

b) Desarrolle una columna de ingreso promedio por empleado Encuentre la recta de regresioacuten

jor describa esa variable como funcioacuten del antildeo (con 1984 codificado como 1 1985 como 2tamantildeo promedio de la tienda iquestSon maacutes productivos los empleados en tiendas maacutes granderecta de tendencia (el factor de regresioacuten ANtildeO) un factor maacutes importante Como analista iquestriacutea la tendencia a poner tiendas maacutes grandes como una estrategia exitosa o juzgariacutea que la y otros factores son maacutes importantes

Tamantildeo promedio Ingreso NuacutemeroNuacutemero de tienda total de

Antildeo de tiendas (miles de pies2) (millones de doacutelares) empleados

1984 31 77 433 4000

1985 50 80 701 5400

1986 60 80 1001 6600

1987 75 82 1454 9100

1988 96 86 2000 13000

1989 118 88 2758 17500

1990 145 92 3815 21500

1991 174 95 5136 28000

1992 214 98 7148 38900

1993 264 100 9239 50600

1994 340 103 12477 67300

Fuente Home Depot Annual Reports 1993 y 1994

13-59 Wal-Mart es una de las compantildeiacuteas maacutes grandes y exitosas de Estados Unidos con maacutes de 240en operacioacuten y ventas anuales por $82 mil millones de doacutelares En el inicio la compantildeiacutea daba unate tasa de rendimiento (ROE) a sus accionistas pero su desempentildeo en este rubro ha decaiacutedo Juncrecimiento raacutepido la empresa se ha expandido maacutes allaacute de concepto original de tienda y ahorSamrsquos Club que es una operacioacuten de margen muy bajo con fuerte rotacioacuten de inventario Los sidatos muestran cifras para los antildeos fiscales que terminan en enero de la fecha mostrada el inveporcentaje de tiendas que eran Samrsquos Club y ROE

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1985 12 15 367

1986 15 26 333

1987 22 48 352

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE

7312019 Aacap 13 Regresion Multiple y Modelado

httpslidepdfcomreaderfullaacap-13-regresion-multiple-y-modelado 5656

Inventario Porcentaje deAntildeo (miles de millones de doacutelares) Samrsquos Club ROE

1988 28 70 371

1989 36 77 371

1990 47 81 358

1991 62 86 326

1992 78 108 300

1993 98 122 285

1994 115 177 266

1995 144 177 249Fuente Wal-Mart Annual Report 1995

Desarrolle una ecuacioacuten de regresioacuten muacuteltiple para pronosticar la ROE para Wal Mart con base evariables dadas iquestQueacute consejo dariacutea a los administradores de la empresa para aumentar la ROE