Regresión Lineal Múltiple, pronósticos
-
Upload
jefferson-abarca -
Category
Documents
-
view
95 -
download
13
description
Transcript of Regresión Lineal Múltiple, pronósticos
regresin lineal mltiple
regresin lineal mltipleInforme de laboratorio
Este trabajo se lo dedico a mis padres, ya que ellos me ensearon a que nunca debo darme por vencido al querer alcanzar una meta. Y que el esfuerzo siempre trae recompensas.
TABLA DE CONTENIDO
INTRODUCCIN3MARCO TERICO4PREGUNTAS DEL INFORME61.Condiciones que debe cumplir las variables independientes para formar parte de un modelo mltiples62.Condiciones debe cumplir la parte de perturbacin del modelo mltiple63.Causas para asumir que existe colinealidad o multicolinealidad74.Si tenemos el caso de multicolinealidad cmo construimos un modelo confiable para hacer el pronstico?75.Evale los ejercicios de la separata y construya el modelo adecuado para hacer el pronstico.12CONCLUSIONES52RECOMENDACIONES53
INTRODUCCIN
El objeto de un anlisis de regresin es investigar la relacin estadstica que existe entre una variabledependiente(Y) y una o ms variablesindependientes ( ). Para poder realizar esta investigacin, se debe postular una relacin funcional entre las variables. Debido a su simplicidad analtica, la forma funcional que ms se utiliza en la prctica es la relacinlineal. Cuando solo existe una variable independiente, esto se reduce a una lnea recta:
Donde los coeficientesb0yb1son parmetros que definen la posicin e inclinacin de la recta. (Ntese que hemos usado el smbolo especial para representar el valor de Ycalculado por la recta. Como veremos, el valor real deYrara vez coincide exactamente con el valor calculado, por lo que es importante hacer esta distincin.)
El parmetrob0, conocido como la "ordenada en el origen," nos indica cunto esY cuandoX= 0. El parmetrob1, conocido como la "pendiente," nos indica cunto aumentaYpor cada aumento de una unidad enX. Nuestro problema consiste en obtener estimaciones de estos coeficientes a partir de una muestra de observaciones sobre las variablesYyX. En el anlisis de regresin, estas estimaciones se obtienen por medio del mtodo demnimos cuadrados.Como laEstadsticaInferencial nos permite trabajar con una variable a nivel de intervalo o razn, as tambin se puede comprender la relacin de dos o msvariablesy nos permitir relacionar medianteecuaciones, una variable en relacin de la otra variable llamndose Regresin Lineal y una variable en relacin a otras variables llamndose Regresin mltiple.En el presente informe se presentar un marco terico respecto a la regresin lineal mltiple, adems estos sern acompaados de una serie de ejercicios resuelto en el SPSS. De esta forma se concretar la teora con la aplicacin de esta en los ejercicios antes mencionados.
MARCO TERICOEl modelo de regresin mltiple con k variables explicativas, para el modelo poblacional, es el siguiente:Yi = 0 + 1 Xi1 + 2 Xi2 + + k Xij + eiDonde:Yi: Es la variable de datos independientes para la i-esima observacinj: Es el coeficiente de la j-esima observacinXij: Es la j-esima variable independiente para la i-esima observacinEi: es el i-esimo error
COEFICIENTE DE DETERMINACIN.Uno de los puntos ms importantes en el modelo de regresin, en general, es determinar la relacin que hay entre el conjunto de variables independientes y la variable dependiente. Una de las medidas para cuantificar esta relacin es el coeficiente de determinacin (R2); el cual representa la porcin de varianza total de Y explicada por el modelo. Este coeficiente vara entre cero y uno y se calcula mediante la siguiente formula:
Donde:SCM: Suma de cuadrados del modeloSCT: Suma de cuadrados totales.
EL ERROR ESTNDAR DE LA REGRESIN MLTIPLEEs una medida de dispersin la estimacin se hace ms precisa conforme el grado de dispersin alrededor del plano de regresin se hace ms pequeo.Para medirla se utiliza la frmula:
Y: Valores observados en la muestra: Valores estimados a partir a partir de la ecuacin de regresinn : Nmero de datosm : Nmero de variables independientes
MULTICOLINEALIDADEl problema de multicolinealidad en un modelo de regresin simple es que los coeficientes de regresin son indeterminados y sus errores estndar son infinitos. Si la multicolinealidad no es perfecta es que los errores estndar son muy grandes; lo cual implica que de llevarse a cabo inferencias sobre los intervalos de confianza para estos parmetros van a ser artificialmente grandes.
En otras palabras esto se traduce en que cuando hay multicolinealidad se encuentran razones t no significativas a pesar de que las variables importantes para explicar. Como los errores estndar son altos disminuye de manera considerable el valor t; lo cual nos lleva con facilidad a aceptar la hiptesis nula. Una forma sencilla de detectar multicolinealidad es tener varias s (o todas) iguales a cero y una alta R2.
COEFICIENTE DE CORRELACIN DE PEARSON (R)Si tenemos dos variables cuantitativas y deseamos medir el grado de asociacin podemos utilizar el coeficiente de correlacin de Pearson. En primer lugar, es muy aconsejable realizar un grfico de dispersin entre ambas variables y estudiar visualmente la relacin entre ellas. Este coeficiente mide asociacin lineal y al ser una prueba paramtrica requiere para su uso que ambas variables tengan distribuciones normales1. De no ser as, deberemos utilizar el coeficiente no paramtrico de Spearman.
PREGUNTAS DEL INFORME
1. Condiciones que debe cumplir las variables independientes para formar parte de un modelo mltiplesLas variables independientes no pueden estar altamente correlacionadas entre s, las relaciones entre las causas y el resultado deben ser lineales, todas variables deben seguir la distribucin normal y deben tener varianzas iguales. Estas condiciones no son tan estrictas y hay maneras de tratar los datos si se incumple. Sobre ello volveremos en futuras entradas.Tenemos ciertos requerimientos necesarios para poder realizar la tcnica de regresin mltiple:LINEALIDAD, se supone que la variable dependiente depende linealmente de las variables independientes. Si la dependiente no aparenta ser lineal, debemos introducir en el modelo componentes no lineales. NORMALIDAD Y EQUIDISTRIBUCIN DE LOS RESIDUOS, se llaman residuos las diferencias entre los valores calculados por el modelo y los realmente observados en la variable dependiente para temer un buen modelo de regresin no es suficiente con que los residuos sean pequeos. NUMERO DE VARIABLES INDEPENDIENTES: podemos estar tentados en incluir en el modelo cualquier cosa que tengamos en una base de datos. COLINEALIDAD: si dos variables independientes estn estrechamente relacionadas y ambas son incluidas en un modelo, muy posiblemente ninguna de las dos sea considerada significativa.
2. Condiciones debe cumplir la parte de perturbacin del modelo mltiple
Es conocida tambin como el error; la simbologa utilizada para la perturbacin aleatoria es la siguiente: .Esta recoge todos aquellos factores de la realidad no controlables u observables y que por tanto se asocian con el azar y es la que confiere al modelo su carcter estocstico (es aquel cuyo comportamiento es nodeterminista)
Esta perturbacin o error sigue el supuesto de modo que tiene distribucin normal con media cero, adems la varianza es constante.
3. Causas para asumir que existe colinealidad o multicolinealidadCOLINEALIDADSi en un modelo de regresin lineal mltiple alguna variable independiente es combinacin lineal de otras, el modelo es irresoluble, debido a que, en ese caso, la matrizX'Xes singular, es decir, su determinante es cero y no se puede invertir.A este fenmeno se le denominacolinealidad.Que una variableX1sea combinacin lineal de otraX2, significa que ambas estn relacionadas por la expresin X1=b1+b2X2, siendob1yb2constantes, por lo tanto el coeficiente de correlacin entre ambas variables ser 1.Que una variableX1sea combinacin lineal de otrasX2,..., Xiconi>2, significa que dichas variables estn relacionadas por la expresin X1=b1> +b2X2+... +biXi, siendob1,...,biconstantes y por tanto, el coeficiente de correlacin mltiple RX1|X2,...Xitambin ser 1.
MULTICOLINEALIDADConsiste en la existencia de relaciones lineales entre dos o ms variables independientes del modelo lineal uniecuacional mltiple. Dependiendo de cmo sea dicha relacin lineal hablaremos de multicolinealidad perfecta o aproximada. Las principales causas que producen multicolinealidad en un modelo son: Relacin causal entre variables explicativas del modelo Escasa variabilidad en las observaciones de las variables independientes Reducido tamao de la muestraEn definitiva la multicolinealidad suele ser un problema muestral que se presenta normalmente en datos con el perfil de series de tiempo.
4. Si tenemos el caso de multicolinealidad cmo construimos un modelo confiable para hacer el pronstico?Algunas de las posibles soluciones al problema de multicolinealidad son las siguientes: Mejora del diseo muestral extrayendo la informacin mxima de la variables observadas Eliminacin de las variables que se sospechan son causantes de la multicolinealidad En caso de disponer de pocas observaciones, aumentar el tamao de la muestra Utilizar la eleccin extramuestral que permite realizar relaciones entre los parmetros que permite estimar el modelo por mnimos cuadrados restringidos.
En primer lugar se debe colocar todos los datos en el SPSS, primero en la vista de variables y luego se pasan todos los datos que tenemos. Algo que es importante es elegir en medida Escala.
Luego nos dirigimos a analizar, regresin, lineal para obtener el cuadro de dialogo en el cual ubicaremos los datos.
Despus pasaremos a escoger la opcin estadsticos donde se seleccionaran los siguientes tems. Luego ponemos Continuar y aceptar.
Estos son los resultados que obtendremos. Regresin
Resumen del modelob
ModeloRR cuadradoR cuadrado corregidaError tp. de la estimacinDurbin-Watson
1,661a,437,06163,0958282,330
a. Variables predictoras: (Constante), Antiguedad del edificio, en aos, Numero de accesos, Numero de oficinas, Superficie en metros cuadrados
b. Variable dependiente: Valor de tasacin del edificio de oficinas
ANOVAa
ModeloSuma de cuadradosglMedia cuadrticaFSig.
1Regresin18515,72644628,9321,163,413b
Residual23886,50163981,083
Total42402,22710
a. Variable dependiente: Valor de tasacin del edificio de oficinas
b. Variables predictoras: (Constante), Antiguedad del edificio, en aos, Numero de accesos, Numero de oficinas, Superficie en metros cuadrados
Coeficientesa
ModeloCoeficientes no estandarizadosCoeficientes tipificadostSig.Estadsticos de colinealidad
BError tp.BetaToleranciaFIV
1(Constante)1239,841654,6941,894,107
Superficie en metros cuadrados-506,910290,537-,688-1,745,132,6031,657
Numero de oficinas30,56926,004,3801,176,284,8991,112
Numero de accesos26,12333,760,312,774,468,5781,731
Antiguedad del edificio, en aos,336,847,126,397,705,9271,078
a. Variable dependiente: Valor de tasacin del edificio de oficinas
Diagnsticos de colinealidada
ModeloDimensinAutovaloresndice de condicinProporciones de la varianza
(Constante)Superficie en metros cuadradosNumero de oficinasNumero de accesosAntiguedad del edificio, en aos
114,6421,000,00,00,00,00,01
2,2514,305,00,00,02,02,83
3,0598,897,00,00,43,55,01
4,0489,810,01,00,54,10,10
5,000108,630,991,00,01,33,06
a. Variable dependiente: Valor de tasacin del edificio de oficinas
Estadsticos sobre los residuosa
MnimoMximoMediaDesviacin tpicaN
Valor pronosticado99,18463245,02170170,4454543,02990411
Residual-46,979633114,978294,00000048,87381811
Valor pronosticado tip.-1,6561,733,0001,00011
Residuo tp.-,7451,822,000,77511
a. Variable dependiente: Valor de tasacin del edificio de oficinas
Para saber si hay problema de multicolinealidad nos percataremos en la inflacin de la varianza (VIF), lo mximo que se puede aceptar son 4 o 5 unidades, en caso el nmero sea mayor al mencionado anteriormente, pues tendremos multicolinealidad o multicolinealidad severa segn sea el caso. Por ello nos dirigiremos a analizar el cuadro de coeficientes. Coeficientesa
ModeloCoeficientes no estandarizadosCoeficientes tipificadostSig.Estadsticos de colinealidad
BError tp.BetaToleranciaFIV
1(Constante)1239,841654,6941,894,107
Superficie en metros cuadrados-506,910290,537-,688-1,745,132,6031,657
Numero de oficinas30,56926,004,3801,176,284,8991,112
Numero de accesos26,12333,760,312,774,468,5781,731
Antiguedad del edificio, en aos,336,847,126,397,705,9271,078
a. Variable dependiente: Valor de tasacin del edificio de oficinas
En este caso la inflacin de la varianza es de 1,657; 1,112; 1,731; 1,078 es decir no hay problemas de multicolinealidad, en caso este nmero sea mayor a 5 se proceder a eliminar aquella variable que tenga el menor correlacin de Pearson, al analizar cada variable independiente con otra variable independiente, con el siguiente procedimiento: Analizar, correlaciones, parciales.De esta forma al eliminar dicha variable disminuira la inflacin de la varianza. Teniendo as un modelo confiable.
5. Evale los ejercicios de la separata y construya el modelo adecuado para hacer el pronstico.
PROBLEMA N 1
fabricacionX1fabricacionX2CircuitosY
-10011
0-58
10573
-10021
0546
10-530
Regresin
Variables entradas/eliminadasa
ModeloVariables introducidasVariables eliminadasMtodo
1fabricacion X2, fabricacion x1b.Intro
a. Variable dependiente: circuitos electricos Y
b. Todas las variables solicitadas introducidas.
Resumen del modelob
ModeloRR cuadradoR cuadrado ajustadoError estndar de la estimacinDurbin-Watson
1,980a,961,9356,2452,346
a. Predictores: (Constante), fabricacion X2, fabricacion x1
b. Variable dependiente: circuitos electricos Y
ANOVAa
ModeloSuma de cuadradosglMedia cuadrticaFSig.
1Regresin2900,50021450,25037,186,008b
Residuo117,000339,000
Total3017,5005
a. Variable dependiente: circuitos electricos Y
b. Predictores: (Constante), fabricacion X2, fabricacion x1
Coeficientesa
ModeloCoeficientes no estandarizadosCoeficientes estandarizadostSig.
BError estndarBeta
1(Constante)31,5002,55012,355,001
fabricacion x11,775,312,6465,685,011
fabricacion X24,050,624,7376,485,007
a. Variable dependiente: circuitos electricos Y
Estadsticas de residuosa
MnimoMximoMediaDesviacin estndarN
Valor pronosticado11,2569,5031,5024,0856
Residuo-5,7507,250,0004,8376
Valor pronosticado estndar-,8411,578,0001,0006
Residuo estndar-,9211,161,000,7756
a. Variable dependiente: circuitos electricos Y
Correlaciones
fabricacion x1fabricacion X2circuitos electricos Y
fabricacion x1Correlacin de Pearson1,000,646
Sig. (bilateral)1,000,166
N666
fabricacion X2Correlacin de Pearson,0001,737
Sig. (bilateral)1,000,094
N666
circuitos electricos YCorrelacin de Pearson,646,7371
Sig. (bilateral),166,094
N666
Coeficientesa
ModeloCoeficientes no estandarizadosCoeficientes estandarizadostSig.Estadsticas de colinealidad
BError estndarBetaToleranciaVIF
1(Constante)31,5002,55012,355,001
fabricacion x11,775,312,6465,685,0111,0001,000
fabricacion X24,050,624,7376,485,0071,0001,000
a. Variable dependiente: circuitos electricos Y
Al verificar la significacin vemos que es de 0.8% por lo cual no existe problema con las variables, luego notamos que la inflacin de la varianza es de 1 por lo cual se esta cumpliendo con el rango aceptable (mximo 5), es decir no hay multicolinealidad, para poder asegurarnos que no existe problemas de autocorrelacin verificamos el Durvin Watson el cual es de 2.346 concluyendo que no hay problema alguno pues no llega al mximo aceptado que es 4.
PROBLEMA N 2
gravedadX1humedadX2fuerzaY
,99011,111,14
,5588,912,74
,6048,813,13
,4418,911,51
,5508,812,38
,5289,912,60
,41810,711,13
,48010,511,70
,40610,511,02
,46710,711,41
Regresin
Variables entradas/eliminadasa
ModeloVariables introducidasVariables eliminadasMtodo
1contenido de humedad, gravedad especificab.Intro
a. Variable dependiente: fuerza
b. Todas las variables solicitadas introducidas.
Resumen del modelob
ModeloRR cuadradoR cuadrado ajustadoError estndar de la estimacinDurbin-Watson
1,782a,611,500,543042,550
a. Predictores: (Constante), contenido de humedad, gravedad especifica
b. Variable dependiente: fuerza
ANOVAa
ModeloSuma de cuadradosglMedia cuadrticaFSig.
1Regresin3,24621,6235,504,037b
Residuo2,0647,295
Total5,3109
a. Variable dependiente: fuerza
b. Predictores: (Constante), contenido de humedad, gravedad especifica
Coeficientesa
ModeloCoeficientes no estandarizadosCoeficientes estandarizadostSig.
BError estndarBeta
1(Constante)17,8651,9359,232,000
gravedad especifica,8611,087,190,792,454
contenido de humedad-,654,197-,795-3,313,013
a. Variable dependiente: fuerza
Estadsticas de residuosa
MnimoMximoMediaDesviacin estndarN
Valor pronosticado11,231412,633411,8760,6005610
Residuo-,91764,75102,00000,4789210
Valor pronosticado estndar-1,0731,261,0001,00010
Residuo estndar-1,6901,383,000,88210
a. Variable dependiente: fuerza
Correlaciones
Correlaciones
gravedad especificacontenido de humedadfuerza
gravedad especificaCorrelacin de Pearson1,188,041
Sig. (bilateral),603,911
N101010
contenido de humedadCorrelacin de Pearson,1881-,759*
Sig. (bilateral),603,011
N101010
fuerzaCorrelacin de Pearson,041-,759*1
Sig. (bilateral),911,011
N101010
*. La correlacin es significativa en el nivel 0,05 (2 colas).
Coeficientesa
ModeloCoeficientes no estandarizadosCoeficientes estandarizadostSig.Estadsticas de colinealidad
BError estndarBetaToleranciaVIF
1(Constante)17,8651,9359,232,000
gravedad especifica,8611,087,190,792,454,9651,037
contenido de humedad-,654,197-,795-3,313,013,9651,037
a. Variable dependiente: fuerza
Al verificar la significacin vemos que es de 3.7% por lo cual no existe problema con las variables, luego notamos que la inflacin de la varianza es de 1.037 por lo cual se est cumpliendo con el rango aceptable (mximo 5), es decir no hay multicolinealidad, para poder asegurarnos que no existe problemas de autocorrelacin verificamos el Durbin Watson el cual es de 2.550 concluyendo que no hay problema alguno pues no llega al mximo aceptado que es 4.
PROBLEMA N 3
automovilesX1telefonosX2consumoY
5811164
84131778
7815883
8114788
8212189
10216599
85174101
102169102
Variables entradas/eliminadasa
ModeloVariables introducidasVariables eliminadasMtodo
1numero de telfonos por mil habitantes, numero de automviles por mil habitantes.Intro
a. Variable dependiente: consumo
b. Todas las variables solicitadas introducidas.
Resumen del modelob
ModeloRR cuadradoR cuadrado ajustadoError estndar de la estimacinDurbin-Watson
1,390a,152-,188265,6342,091
a. Predictores: (Constante), numero de telefonos por mil habitantes, numero de automoviles por mil habitantes
b. Variable dependiente: consumo
ANOVAa
ModeloSuma de cuadradosglMedia cuadrticaFSig.
1Regresin63130,708231565,354,447,663b
Residuo352807,292570561,458
Total415938,0007
a. Variable dependiente: consumo
b. Predictores: (Constante), numero de telefonos por mil habitantes, numero de automoviles por mil habitantes
Coeficientesa
ModeloCoeficientes no estandarizadosCoeficientes estandarizadostSig.Estadsticas de colinealidad
BError estndarBetaToleranciaVIF
1(Constante)367,506669,280,549,607
numero de automoviles por mil habitantes7,84010,362,451,757,483,4782,091
numero de telefonos por mil habitantes-5,7866,161-,559-,939,391,4782,091
a. Variable dependiente: consumo
Diagnsticos de colinealidada
ModeloDimensinAutovalorndice de condicinProporciones de varianza
(Constante)numero de automoviles por mil habitantesnumero de telefonos por mil habitantes
112,9801,000,00,00,00
2,01314,996,99,18,10
3,00621,706,01,82,90
a. Variable dependiente: consumo
Estadsticas de residuosa
MnimoMximoMediaDesviacin estndarN
Valor pronosticado27,12310,26175,5094,9678
Residuo-221,259509,923,000224,5028
Valor pronosticado estndar-1,5621,419,0001,0008
Residuo estndar-,8331,920,000,8458
a. Variable dependiente: consumo
Despus de analizar todos los datos nos damos cuenta que el nivel de significacin de muy alto (66.3%), por lo cual vemos de eliminar aquella variable que en trminos absolutos presente menor coeficiente estandarizado B. Es as que eliminaremos la variable nmero de automviles por mil habitantes.
Regresin
Variables entradas/eliminadasa
ModeloVariables introducidasVariables eliminadasMtodo
1numero de telefonos por mil habitantesb.Intro
a. Variable dependiente: consumo
b. Todas las variables solicitadas introducidas.
Resumen del modelob
ModeloRR cuadradoR cuadrado ajustadoError estndar de la estimacinDurbin-Watson
1,234a,055-,103255,9952,534
a. Predictores: (Constante), numero de telefonos por mil habitantes
b. Variable dependiente: consumo
Coeficientesa
ModeloCoeficientes no estandarizadosCoeficientes estandarizadostSig.Estadsticas de colinealidad
BError estndarBetaToleranciaVIF
1(Constante)531,084610,414,870,418
numero de telefonos por mil habitantes-2,4194,107-,234-,589,5771,0001,000
a. Variable dependiente: consumo
Diagnsticos de colinealidada
ModeloDimensinAutovalorndice de condicinProporciones de varianza
(Constante)numero de telefonos por mil habitantes
111,9891,000,01,01
2,01113,414,99,99
a. Variable dependiente: consumo
Estadsticas de residuosa
MnimoMximoMediaDesviacin estndarN
Valor pronosticado110,19262,58175,5056,9948
Residuo-198,582563,797,000237,0058
Valor pronosticado estndar-1,1461,528,0001,0008
Residuo estndar-,7762,202,000,9268
a. Variable dependiente: consumo
ANOVAa
ModeloSuma de cuadradosglMedia cuadrticaFSig.
1Regresin22738,034122738,034,347,577b
Residuo393199,966665533,328
Total415938,0007
a. Variable dependiente: consumo
b. Predictores: (Constante), numero de telfonos por mil habitantes
Es as que se concluye que no se puede realizar los pronsticos puesto que el nivel de significacin es muy alto aun as eliminada la variable nmero de automviles por mil habitantes.
PROBLEMA N 4
Superficie X1Oficinas X2Accesos X3Antigedad X4Valor Y
231022,020142000
233322,012144000
235631,533161000
227332,040360000
240223,053139000
242542,023169000
244821,599125000
247122,034142000
249433,023163000
251744,055189000
254023,022149000
Regresin
Variables entradas/eliminadasa
ModeloVariables introducidasVariables eliminadasMtodo
1AntiguedadX4, AccesosX3, OficinasX2, SuperficieX1b.Intro
a. Variable dependiente: ValorY
b. Todas las variables solicitadas introducidas.
Resumen del modelob
ModeloRR cuadradoR cuadrado ajustadoError estndar de la estimacinDurbin-Watson
1,672a,451,08562168,0222,235
a. Predictores: (Constante), AntiguedadX4, AccesosX3, OficinasX2, SuperficieX1
b. Variable dependiente: ValorY
ANOVAa
ModeloSuma de cuadradosglMedia cuadrticaFSig.
1Regresin19058458894,23144764614723,5581,233,389b
Residuo23189177469,40663864862911,568
Total42247636363,63610
a. Variable dependiente: ValorY
b. Predictores: (Constante), AntiguedadX4, AccesosX3, OficinasX2, SuperficieX1
Coeficientesa
ModeloCoeficientes no estandarizadosCoeficientes estandarizadostSig.Estadsticas de colinealidad
BError estndarBetaToleranciaVIF
1(Constante)1244642,419645066,9211,929,102
SuperficieX1-508,112286,265-,691-1,775,126,6031,657
OficinasX231764,27425621,636,3951,240,261,8991,112
AccesosX324561,79033263,442,294,738,488,5781,731
AntiguedadX4319,299834,490,120,383,715,9271,078
a. Variable dependiente: ValorY
Diagnsticos de colinealidada
ModeloDimensinAutovalorndice de condicinProporciones de varianza
(Constante)SuperficieX1OficinasX2AccesosX3AntiguedadX4
114,6421,000,00,00,00,00,01
2,2514,305,00,00,02,02,83
3,0598,897,00,00,43,55,01
4,0489,810,01,00,54,10,10
5,000108,630,991,00,01,33,06
a. Variable dependiente: ValorY
Estadsticas de residuosa
MnimoMximoMediaDesviacin estndarN
Valor pronosticado98276,51246892,28171181,8243655,99511
Residuo-47941,875113107,719,00048155,14211
Valor pronosticado estndar-1,6701,734,0001,00011
Residuo estndar-,7711,819,000,77511
a. Variable dependiente: ValorY
Notamos que el nivel de significacin es alto sobrepasando los 20% aceptables (38.9%), por ello se recurrir a eliminar la variable con menor coeficiente estandarizado B en este caso es Antigedad X4 con 0.120.
Regresin
Variables entradas/eliminadasa
ModeloVariables introducidasVariables eliminadasMtodo
1AccesosX3, OficinasX2, SuperficieX1b.Intro
a. Variable dependiente: ValorY
b. Todas las variables solicitadas introducidas.
Resumen del modelob
ModeloRR cuadradoR cuadrado ajustadoError estndar de la estimacinDurbin-Watson
1,662a,438,19758254,3812,127
a. Predictores: (Constante), AccesosX3, OficinasX2, SuperficieX1
b. Variable dependiente: ValorY
ANOVAa
ModeloSuma de cuadradosglMedia cuadrticaFSig.
1Regresin18492625631,99636164208543,9991,816,232b
Residuo23755010731,64173393572961,663
Total42247636363,63610
a. Variable dependiente: ValorY
b. Predictores: (Constante), AccesosX3, OficinasX2, SuperficieX1
Coeficientesa
ModeloCoeficientes no estandarizadosCoeficientes estandarizadostSig.Estadsticas de colinealidad
BError estndarBetaToleranciaVIF
1(Constante)1193512,590591346,6242,018,083
SuperficieX1-479,393258,859-,652-1,852,106,6481,543
OficinasX231450,30123996,371,3911,311,231,9001,111
AccesosX322280,66730664,716,267,727,491,5971,675
a. Variable dependiente: ValorY
Diagnsticos de colinealidada
ModeloDimensinAutovalorndice de condicinProporciones de varianza
(Constante)SuperficieX1OficinasX2AccesosX3
113,8881,000,00,00,00,00
2,0598,107,00,00,26,64
3,0528,609,00,00,73,04
4,00096,5731,001,00,01,31
a. Variable dependiente: ValorY
Estadsticas de residuosa
MnimoMximoMediaDesviacin estndarN
Valor pronosticado105596,79242764,38171181,8243003,05311
Residuo-51576,527117235,625,00048739,11211
Valor pronosticado estndar-1,5251,665,0001,00011
Residuo estndar-,8852,012,000,83711
a. Variable dependiente: ValorY
Al eliminar la variable Antigedad X4 notamos que el nivel de significacin se reduzco, pero no lo suficiente (23.2%), por ello procederemos a eliminar la otra variable con menor coeficiente estandarizado que viene a ser Accesos X3 (0.267). Quedando finalmente los siguientes datos.
Regresin
Variables entradas/eliminadasa
ModeloVariables introducidasVariables eliminadasMtodo
1OficinasX2, SuperficieX1b.Intro
a. Variable dependiente: ValorY
b. Todas las variables solicitadas introducidas.
Resumen del modelob
ModeloRR cuadradoR cuadrado ajustadoError estndar de la estimacinDurbin-Watson
1,629a,395,24456509,5002,046
a. Predictores: (Constante), OficinasX2, SuperficieX1
b. Variable dependiente: ValorY
ANOVAa
ModeloSuma de cuadradosglMedia cuadrticaFSig.
1Regresin16701047815,87328350523907,9362,615,134b
Residuo25546588547,76483193323568,470
Total42247636363,63610
a. Variable dependiente: ValorY
b. Predictores: (Constante), OficinasX2, SuperficieX1
Coeficientesa
ModeloCoeficientes no estandarizadosCoeficientes estandarizadostSig.Estadsticas de colinealidad
BError estndarBetaToleranciaVIF
1(Constante)968423,804488620,9831,982,083
SuperficieX1-369,844204,117-,503-1,812,108,9811,020
OficinasX236439,02322304,435,4541,634,141,9811,020
a. Variable dependiente: ValorY
Diagnsticos de colinealidada
ModeloDimensinAutovalorndice de condicinProporciones de varianza
(Constante)SuperficieX1OficinasX2
112,9471,000,00,00,01
2,0537,469,00,00,98
3,00169,8191,001,00,01
a. Variable dependiente: ValorY
Estadsticas de residuosa
MnimoMximoMediaDesviacin estndarN
Valor pronosticado101897,30237084,75171181,8240866,91511
Residuo-48307,441122915,250,00050543,63311
Valor pronosticado estndar-1,6951,613,0001,00011
Residuo estndar-,8552,175,000,89411
a. Variable dependiente: ValorY
Finalmente al eliminar las variables Antigedad y accesos nos damos cuenta que el nivel de significacin es idneo para realizar el posterior pronstico.
PROBLEMA N 5
Regresin
Variables entradas/eliminadasa
ModeloVariables introducidasVariables eliminadasMtodo
1inversion en propaganda, mesb.Intro
a. Variable dependiente: porcentaje de ventas con respecto al mes anterior
b. Todas las variables solicitadas introducidas.
Resumen del modelob
ModeloRR cuadradoR cuadrado ajustadoError estndar de la estimacinDurbin-Watson
1,968a,937,9195,356782,002
a. Predictores: (Constante), inversion en propaganda, mes
b. Variable dependiente: porcentaje de ventas con respecto al mes anterior
ANOVAa
ModeloSuma de cuadradosglMedia cuadrticaFSig.
1Regresin2978,39521489,19851,897,000b
Residuo200,866728,695
Total3179,2619
a. Variable dependiente: porcentaje de ventas con respecto al mes anterior
b. Predictores: (Constante), inversion en propaganda, en
Coeficientesa
ModeloCoeficientes no estandarizadosCoeficientes estandarizadostSig.Estadsticas de colinealidad
BError estndarBetaToleranciaVIF
1(Constante)68,13013,4175,078,001
mes-4,183,965-,674-4,337,003,3742,675
inversion en propaganda3,5971,631,3432,205,063,3742,675
a. Variable dependiente: porcentaje de ventas con respecto al mes anterior
Diagnsticos de colinealidada
ModeloDimensinAutovalorndice de condicinProporciones de varianza
(Constante)mesinversion en propaganda
112,7191,000,00,01,00
2,2713,164,00,17,05
3,01016,5111,00,82,95
a. Variable dependiente: porcentaje de ventas con respecto al mes anterior
Estadsticas de residuosa
MnimoMximoMediaDesviacin estndarN
Valor pronosticado33,851988,405764,330018,1915610
Residuo-5,8519310,08294,000004,7242410
Valor pronosticado estndar-1,6751,323,0001,00010
Residuo estndar-1,0921,882,000,88210
a. Variable dependiente: porcentaje de ventas con respecto al mes anterior
Al verificar la significacin vemos que es de 0 % por lo cual no existe problema con las variables, luego notamos que la inflacin de la varianza es de 2.675 por lo cual se esta cumpliendo con el rango aceptable (mximo 5), es decir no hay multicolinealidad, para poder asegurarnos que no existe problemas de autocorrelacin verificamos el Durvin Watson el cual es de 2.002 concluyendo que no hay problema alguno pues no llega al mximo aceptado que es 4. Es as que se puede realizar el pronstico.
PROBLEMA N 6
remuneracinYdesempleoX1tiempoX2
2,196,101996
2,236,201969
2,327,801970
2,396,801971
2,465,701972
2,535,001973
2,614,001974
2,723,201975
2,633,601976
3,013,301977
3,193,301978
3,355,601979
3,556,601980
Regresin
Variables entradas/eliminadasa
ModeloVariables introducidasVariables eliminadasMtodo
1tasa de desempleo, remuneracion por horab.Intro
a. Variable dependiente: tiempo
b. Todas las variables solicitadas introducidas.
Resumen del modelob
ModeloRR cuadradoR cuadrado ajustadoError estndar de la estimacinDurbin-Watson
1,146a,021-,1747,4671,326
a. Predictores: (Constante), tasa de desempleo, remuneracion por hora
b. Variable dependiente: tiempo
ANOVAa
ModeloSuma de cuadradosglMedia cuadrticaFSig.
1Regresin12,10726,053,109,898b
Residuo557,5861055,759
Total569,69212
a. Variable dependiente: tiempo
b. Predictores: (Constante), tasa de desempleo, remuneracion por hora
Coeficientesa
ModeloCoeficientes no estandarizadosCoeficientes estandarizadostSig.Estadsticas de colinealidad
BError estndarBetaToleranciaVIF
1(Constante)1970,96817,785110,821,000
remuneracion por hora2,1385,144,136,416,686,9141,094
tasa de desempleo-,1161,457-,026-,079,938,9141,094
a. Variable dependiente: tiempo
Diagnsticos de colinealidada
ModeloDimensinAutovalorndice de condicinProporciones de varianza
(Constante)remuneracion por horatasa de desempleo
112,9241,000,00,00,01
2,0676,592,01,10,66
3,00818,665,99,90,34
a. Variable dependiente: tiempo
Estadsticas de residuosa
MnimoMximoMediaDesviacin estndarN
Valor pronosticado1974,941977,791976,151,00413
Residuo-6,00921,057,0006,81713
Valor pronosticado estndar-1,2051,632,0001,00013
Residuo estndar-,8052,820,000,91313
a. Variable dependiente: tiempo
El nivel de significacin es muy alto (89.9%) por ello procederemos a eliminar la variable con menor coeficiente estandarizado B, es decir la tasa de desempleo (0.079). Es as que tendremos otros cuadros.
Regresin
Variables entradas/eliminadasa
ModeloVariables introducidasVariables eliminadasMtodo
1remuneracion por horab.Intro
a. Variable dependiente: tiempo
b. Todas las variables solicitadas introducidas.
Resumen del modelob
ModeloRR cuadradoR cuadrado ajustadoError estndar de la estimacinDurbin-Watson
1,144a,021-,0687,1221,326
a. Predictores: (Constante), remuneracion por hora
b. Variable dependiente: tiempo
ANOVAa
ModeloSuma de cuadradosglMedia cuadrticaFSig.
1Regresin11,755111,755,232,640b
Residuo557,9381150,722
Total569,69212
a. Variable dependiente: tiempo
b. Predictores: (Constante), remuneracion por hora
Coeficientesa
ModeloCoeficientes no estandarizadosCoeficientes estandarizadostSig.Estadsticas de colinealidad
BError estndarBetaToleranciaVIF
1(Constante)1970,04512,843153,392,000
remuneracion por hora2,2584,690,144,481,6401,0001,000
a. Variable dependiente: tiempo
Diagnsticos de colinealidada
ModeloDimensinAutovalorndice de condicinProporciones de varianza
(Constante)remuneracion por hora
111,9881,000,01,01
2,01212,927,99,99
a. Variable dependiente: tiempo
Estadsticas de residuosa
MnimoMximoMediaDesviacin estndarN
Valor pronosticado1974,991978,061976,15,99013
Residuo-6,07021,011,0006,81913
Valor pronosticado estndar-1,1771,926,0001,00013
Residuo estndar-,8522,950,000,95713
a. Variable dependiente: tiempo
El nivel de significacin sigue siendo muy alto (64%), es as que se concluye que no se puede realizar el pronstico pues no es confiable.
PROBLEMA N 7
UtilidadOfertaIPCprecio otrasaccion
2,54,02,12250
3,8,01,93290
4,8-1,02,3533
4,11,01,83298
2,15,01,51129
1,98,02,0-2107
Regresin
Variables entradas/eliminadasa
ModeloVariables introducidasVariables eliminadasMtodo
1precio por accion , variacion en precio otras empresas, variacion meisl de IPC, porcentaje de oferta sore la demandab.Intro
a. Variable dependiente: utilidad toatal mensual de la empresa
b. Todas las variables solicitadas introducidas.
Resumen del modelob
ModeloRR cuadradoR cuadrado ajustadoError estndar de la estimacinDurbin-Watson
1,969a,940,698,65561,977
a. Predictores: (Constante), precio por accion , variacion en precio otras empresas, variacion meisl de IPC, porcentaje de oferta sore la demanda
b. Variable dependiente: utilidad toatal mensual de la empresa
ANOVAa
ModeloSuma de cuadradosglMedia cuadrticaFSig.
1Regresin6,69041,6733,891,361b
Residuo,4301,430
Total7,1205
a. Variable dependiente: utilidad toatal mensual de la empresa
b. Predictores: (Constante), precio por accion , variacion en precio otras empresas, variacion meisl de IPC, porcentaje de oferta sore la demanda
Coeficientesa
ModeloCoeficientes no estandarizadosCoeficientes estandarizadostSig.Estadsticas de colinealidad
BError estndarBetaToleranciaVIF
1(Constante)4,1353,4571,196,443
porcentaje de oferta sore la demanda-,477,361-1,371-1,320,413,05617,876
variacion meisl de IPC,5951,227,136,485,712,7651,307
variacion en precio otras empresas-,264,594-,460-,445,733,05717,638
precio por accion-,001,003-,102-,373,772,8031,246
a. Variable dependiente: utilidad toatal mensual de la empresa
Diagnsticos de colinealidada
ModeloDimensinAutovalorndice de condicinProporciones de varianza
(Constante)porcentaje de oferta sore la demandavariacion meisl de IPCvariacion en precio otras empresasprecio por accion
113,7791,000,00,00,00,00,01
21,0121,933,00,02,00,01,00
3,1924,431,00,00,01,01,73
4,01316,863,00,54,42,65,01
5,00430,1291,00,44,57,33,25
a. Variable dependiente: utilidad toatal mensual de la empresa
Estadsticas de residuosa
MnimoMximoMediaDesviacin estndarN
Valor pronosticado1,7874,7543,2001,15676
Residuo-,3498,4956,0000,29326
Valor pronosticado estndar-1,2211,344,0001,0006
Residuo estndar-,534,756,000,4476
Notamos que el nivel de significacin es alto (36.1%), transgrediendo el lmite aceptable de 20%, por ello se proceder a eliminar la variable que tenga menor coeficiente estandarizado B, en este caso es la variable precio por accin (0.102). De esta forma se tendr los siguientes datos.
Regresin
Variables entradas/eliminadasa
ModeloVariables introducidasVariables eliminadasMtodo
1variacion en precio otras empresas, variacion meisl de IPC, porcentaje de oferta sore la demandab.Intro
a. Variable dependiente: utilidad toatal mensual de la empresa
b. Todas las variables solicitadas introducidas.
Resumen del modelob
ModeloRR cuadradoR cuadrado ajustadoError estndar de la estimacinDurbin-Watson
1,965a,931,828,49491,326
a. Predictores: (Constante), variacion en precio otras empresas, variacion meisl de IPC, porcentaje de oferta sore la demanda
b. Variable dependiente: utilidad toatal mensual de la empresa
ANOVAa
ModeloSuma de cuadradosglMedia cuadrticaFSig.
1Regresin6,63032,2109,024,101b
Residuo,4902,245
Total7,1205
a. Variable dependiente: utilidad toatal mensual de la empresa
b. Predictores: (Constante), variacion en precio otras empresas, variacion meisl de IPC, porcentaje de oferta sore la demanda
Coeficientesa
ModeloCoeficientes no estandarizadosCoeficientes estandarizadostSig.Estadsticas de colinealidad
BError estndarBetaToleranciaVIF
1(Constante)3,4542,2171,558,260
porcentaje de oferta sore la demanda-,447,266-1,285-1,681,235,05916,990
variacion meisl de IPC,764,861,175,887,469,8851,130
variacion en precio otras empresas-,232,444-,404-,524,653,05817,268
a. Variable dependiente: utilidad toatal mensual de la empresa
Diagnsticos de colinealidada
ModeloDimensinAutovalorndice de condicinProporciones de varianza
(Constante)porcentaje de oferta sore la demandavariacion meisl de IPCvariacion en precio otras empresas
112,9731,000,00,00,00,00
21,0081,717,00,02,00,01
3,01314,876,00,52,52,61
4,00623,2071,00,46,48,38
a. Variable dependiente: utilidad toatal mensual de la empresa
Estadsticas de residuosa
MnimoMximoMediaDesviacin estndarN
Valor pronosticado1,7554,6133,2001,15156
Residuo-,4086,4148,0000,31306
Valor pronosticado estndar-1,2551,227,0001,0006
Residuo estndar-,826,838,000,6326
a. Variable dependiente: utilidad toatal mensual de la empresa
Al ser eliminada la variable precio por accin (0.102 como coeficiente estandarizado B) notamos que el nivel de significacin se redujo a 10.1%, siendo este aceptable para realizar el pronstico.
PROBLEMA N 8
consumo Ymaquina X1distancia X2rendimientoX3
320206302,40
200103964,00
1855013952,80
376227202,60
24051204230,60
893401752,10
1930934000,06
601038015780,01
1540753080,04
Regresin
Variables entradas/eliminadasa
ModeloVariables introducidasVariables eliminadasMtodo
1rendimiento promedio motores, numero de horas maquinas, distancia de transportesb.Intro
a. Variable dependiente: consumo diario de petroleo
b. Todas las variables solicitadas introducidas.
Resumen del modelob
ModeloRR cuadradoR cuadrado ajustadoError estndar de la estimacinDurbin-Watson
1,992a,984,974300,4402,876
a. Predictores: (Constante), rendimiento promedio motores, numero de horas maquinas, distancia de transportes
b. Variable dependiente: consumo diario de petroleo
ANOVAa
ModeloSuma de cuadradosglMedia cuadrticaFSig.
1Regresin27323432,84539107810,948100,901,000b
Residuo451322,044590264,409
Total27774754,8898
a. Variable dependiente: consumo diario de petroleo
b. Predictores: (Constante), rendimiento promedio motores, numero de horas maquinas, distancia de transportes
Coeficientesa
ModeloCoeficientes no estandarizadosCoeficientes estandarizadostSig.Estadsticas de colinealidad
BError estndarBetaToleranciaVIF
1(Constante)481,348213,7782,252,074
numero de horas maquinas7,67314,201,472,540,612,004235,176
distancia de transportes,170,342,438,495,641,004240,140
rendimiento promedio motores-167,59884,515-,139-1,983,104,6631,509
a. Variable dependiente: consumo diario de petroleo
Diagnsticos de colinealidada
ModeloDimensinAutovalorndice de condicinProporciones de varianza
(Constante)numero de horas maquinasdistancia de transportesrendimiento promedio motores
112,6841,000,02,00,00,01
21,1741,512,02,00,00,17
3,1404,378,93,00,00,75
4,00145,903,021,001,00,06
a. Variable dependiente: consumo diario de petroleo
Estadsticas de residuosa
MnimoMximoMediaDesviacin estndarN
Valor pronosticado-45,146072,111539,891848,0889
Residuo-447,355385,930,000237,5199
Valor pronosticado estndar-,8582,452,0001,0009
Residuo estndar-1,4891,285,000,7919
a. Variable dependiente: consumo diario de petroleo
Si bien es cierto el nivel de significacin es bajo, encontramos que la inflacin de la varianza es muy alta (233.176, 240.140) para poder disminuir esta inflacin (VIF) procederemos a eliminar la variable con menor coeficiente estandarizado B, en este caso es la variable rendimiento promedio de motores (0.139). Encontrando los siguientes datos modificados.
Regresin
Variables entradas/eliminadasa
ModeloVariables introducidasVariables eliminadasMtodo
1distancia de transportes, numero de horas maquinasb.Intro
a. Variable dependiente: consumo diario de petroleo
b. Todas las variables solicitadas introducidas.
Resumen del modelob
ModeloRR cuadradoR cuadrado ajustadoError estndar de la estimacinDurbin-Watson
1,985a,971,961366,5811,848
a. Predictores: (Constante), distancia de transportes, numero de horas maquinas
b. Variable dependiente: consumo diario de petroleo
ANOVAa
ModeloSuma de cuadradosglMedia cuadrticaFSig.
1Regresin26968463,962213484231,981100,343,000b
Residuo806290,9276134381,821
Total27774754,8898
a. Variable dependiente: consumo diario de petroleo
b. Predictores: (Constante), distancia de transportes, numero de horas maquinas
Coeficientesa
ModeloCoeficientes no estandarizadosCoeficientes estandarizadostSig.Estadsticas de colinealidad
BError estndarBetaToleranciaVIF
1(Constante)174,495179,976,970,370
numero de horas maquinas1,47616,903,091,087,933,004223,787
distancia de transportes,347,403,895,860,423,004223,787
a. Variable dependiente: consumo diario de petroleo
Diagnsticos de colinealidada
ModeloDimensinAutovalorndice de condicinProporciones de varianza
(Constante)numero de horas maquinasdistancia de transportes
112,5181,000,05,00,00
2,4802,290,71,00,00
3,00143,166,241,001,00
a. Variable dependiente: consumo diario de petroleo
Estadsticas de residuosa
MnimoMximoMediaDesviacin estndarN
Valor pronosticado326,606208,521539,891836,0449
Residuo-547,134586,254,000317,4699
Valor pronosticado estndar-,6612,543,0001,0009
Residuo estndar-1,4931,599,000,8669
a. Variable dependiente: consumo diario de petroleo
Aun as eliminada la variable rendimiento promedio motores sigue habiendo alta inflacin de la varianza, es decir sigue habiendo multicolinealidad severa(223.787). Por ello procederemos a eliminar la siguiente variable con menor coeficiente estandarizado B, que viene a ser nmero de horas mquinas (0.91).
Regresin
Variables entradas/eliminadasa
ModeloVariables introducidasVariables eliminadasMtodo
1distancia de transportesb.Intro
a. Variable dependiente: consumo diario de petroleo
b. Todas las variables solicitadas introducidas.
Resumen del modelob
ModeloRR cuadradoR cuadrado ajustadoError estndar de la estimacinDurbin-Watson
1,985a,971,967339,6041,866
a. Predictores: (Constante), distancia de transportes
b. Variable dependiente: consumo diario de petroleo
ANOVAa
ModeloSuma de cuadradosglMedia cuadrticaFSig.
1Regresin26967439,539126967439,539233,827,000b
Residuo807315,3507115330,764
Total27774754,8898
a. Variable dependiente: consumo diario de petroleo
b. Predictores: (Constante), distancia de transportes
Coeficientesa
ModeloCoeficientes no estandarizadosCoeficientes estandarizadostSig.Estadsticas de colinealidad
BError estndarBetaToleranciaVIF
1(Constante)182,439143,8581,268,245
distancia de transportes,382,025,98515,291,0001,0001,000
a. Variable dependiente: consumo diario de petroleo
Diagnsticos de colinealidada
ModeloDimensinAutovalorndice de condicinProporciones de varianza
(Constante)distancia de transportes
111,6171,000,19,19
2,3832,055,81,81
a. Variable dependiente: consumo diario de petroleo
Estadsticas de residuosa
MnimoMximoMediaDesviacin estndarN
Valor pronosticado333,716210,171539,891836,0099
Residuo-530,309606,761,000317,6709
Valor pronosticado estndar-,6572,544,0001,0009
Residuo estndar-1,5621,787,000,9359
a. Variable dependiente: consumo diario de petroleo
Al ser eliminada la variable nmero de horas mquinas encontramos que persiste baja el nivel de significacin y la inflacin de la varianza disminuyo considerablemente en 1, pudiendo realizarse ahora si el pronstico.
PROBLEMA N 9
ytiempoX1utilidadX2variacionX3reajusteX4
29,01984331,029,6
14,919852819,014,9
23,119861219,823,1
29,81987921,029,8
12,019881418,712,0
23,51989-122,623,5
33,61990626,633,6
Regresin
Variables entradas/eliminadasa
ModeloVariables introducidasVariables eliminadasMtodo
1reajusteX4, tiempoX1, utilidadX2, variacionX3b.Intro
a. Variable dependiente: Y
b. Todas las variables solicitadas introducidas.
Resumen del modelob
ModeloRR cuadradoR cuadrado ajustadoError estndar de la estimacinDurbin-Watson
11,000a1,0001,000,05452,162
a. Predictores: (Constante), reajusteX4, tiempoX1, utilidadX2, variacionX3
b. Variable dependiente: Y
ANOVAa
ModeloSuma de cuadradosglMedia cuadrticaFSig.
1Regresin378,034494,50931870,972,000b
Residuo,0062,003
Total378,0406
a. Variable dependiente: Y
b. Predictores: (Constante), reajusteX4, tiempoX1, utilidadX2, variacionX3
Coeficientesa
ModeloCoeficientes no estandarizadosCoeficientes estandarizadostSig.Estadsticas de colinealidad
BError estndarBetaToleranciaVIF
1(Constante)-114,62026,222-4,371,049
tiempoX1,058,013,0164,409,048,6131,632
utilidadX2,006,004,0071,659,239,3892,569
variacionX3-,041,009-,024-4,787,041,3203,130
reajusteX41,010,0041,019228,707,000,3952,530
a. Variable dependiente: Y
Diagnsticos de colinealidada
ModeloDimensinAutovalorndice de condicinProporciones de varianza
(Constante)tiempoX1utilidadX2variacionX3reajusteX4
114,4861,000,00,00,01,00,00
2,4753,073,00,00,28,00,01
3,02912,534,00,00,35,00,72
4,01120,486,00,00,10,72,22
53,092E-73808,6881,001,00,28,27,05
a. Variable dependiente: Y
Estadsticas de residuosa
MnimoMximoMediaDesviacin estndarN
Valor pronosticado12,04333,59823,7007,93767
Residuo-,0431,0397,0000,03147
Valor pronosticado estndar-1,4691,247,0001,0007
Residuo estndar-,792,730,000,5777
a. Variable dependiente: Y
Notamos que el nivel de significacin es aceptable para realizar el pronstico (0%), adems el Durbin Watson es de 2.162, menor a 4 por ello tambin es aceptable. Los niveles de inflacin de la varianza (VIF) son tambin bajos por ello se puede realizar el pronstico.PROBLEMA N 10
gastoYingresoX1tamaoX2
,432,13
,311,14
,32,95
,461,64
1,256,24
,442,33
,521,86
,291,05
1,298,93
,352,42
,351,24
,784,73
,433,52
,472,93
,381,44
Regresin
Variables entradas/eliminadasa
ModeloVariables introducidasVariables eliminadasMtodo
1tamaoX2, ingresox1b.Intro
a. Variable dependiente: gastoY
b. Todas las variables solicitadas introducidas.
Resumen del modelob
ModeloRR cuadradoR cuadrado ajustadoError estndar de la estimacinDurbin-Watson
1,974a,950,941,077511,177
a. Predictores: (Constante), tamaoX2, ingresox1
b. Variable dependiente: gastoY
ANOVAa
ModeloSuma de cuadradosglMedia cuadrticaFSig.
1Regresin1,3602,680113,141,000b
Residuo,07212,006
Total1,43214
a. Variable dependiente: gastoY
b. Predictores: (Constante), tamaoX2, ingresox1
Coeficientesa
ModeloCoeficientes no estandarizadosCoeficientes estandarizadostSig.Estadsticas de colinealidad
BError estndarBetaToleranciaVIF
1(Constante)-,160,090-1,775,101
ingresox1,149,0101,04414,915,000,8571,166
tamaoX2,077,020,2683,825,002,8571,166
a. Variable dependiente: gastoY
Diagnsticos de colinealidada
ModeloDimensinAutovalorndice de condicinProporciones de varianza
(Constante)ingresox1tamaoX2
112,6341,000,01,04,01
2,3372,797,01,65,05
3,0299,589,98,32,94
a. Variable dependiente: gastoY
Notamos que el nivel de significacin es bajo (0%) , el Durbin Watson es 1.177 con lo cual est dentro del rango aceptable que es hasta los 4, finalmente notamos que la inflacin de la varianza (VIF) es baja 1.166 es as que no encontramos problemas de multicolinealidad ni autocorrelacin.
PROBLEMA N 11
temperaturaYlatitudX1altitudX2longitudX3
5629,7674195,367
4832,85044096,850
6026,9332597,800
4631,9502851102,183
3834,8003840102,467
4633,450146199,633
5328,700815100,483
4632,4502380100,533
4431,8003918106,400
Regresin
Variables entradas/eliminadasa
ModeloVariables introducidasVariables eliminadasMtodo
1longitud de la estacion, latitud, altitud en piesb.Intro
a. Variable dependiente: temperatura en F
b. Todas las variables solicitadas introducidas.
Resumen del modelob
ModeloRR cuadradoR cuadrado ajustadoError estndar de la estimacinDurbin-Watson
1,992a,984,9741,0782,887
a. Predictores: (Constante), longitud de la estacion, latitud, altitud en pies
b. Variable dependiente: temperatura en F
ANOVAa
ModeloSuma de cuadradosglMedia cuadrticaFSig.
1Regresin352,4133117,471101,109,000b
Residuo5,80951,162
Total358,2228
a. Variable dependiente: temperatura en F
b. Predictores: (Constante), longitud de la estacion, latitud, altitud en pies
Coeficientesa
ModeloCoeficientes no estandarizadosCoeficientes estandarizadostSig.Estadsticas de colinealidad
BError estndarBetaToleranciaVIF
1(Constante)155,59541,3763,761,013
latitud-1,938,274-,719-7,084,001,3153,179
altitud en pies-,001,001-,200-,903,408,06615,119
longitud de la estacion-,446,366-,221-1,218,278,09810,183
a. Variable dependiente: temperatura en F
Diagnsticos de colinealidada
ModeloDimensinAutovalorndice de condicinProporciones de varianza
(Constante)latitudaltitud en pieslongitud de la estacion
113,6821,000,00,00,00,00
2,3153,418,00,00,07,00
3,00337,346,00,44,02,01
44,182E-5296,7331,00,56,92,99
a. Variable dependiente: temperatura en F
Estadsticas de residuosa
MnimoMximoMediaDesviacin estndarN
Valor pronosticado39,1759,7948,566,6379
Residuo-1,488,896,000,8529
Valor pronosticado estndar-1,4141,693,0001,0009
Residuo estndar-1,380,831,000,7919
a. Variable dependiente: temperatura en F
Notamos el nivel de significacin es bajo (0%), pero la inflacin de la varianza es de 15.119 y 10.183, excediendo lo permitido encontrando problemas de multicolinealidad, para ello pasaremos a eliminar la variable con menor coeficiente estandarizado que viene a ser la altitud en pies (0.200), encontrando los siguientes datos ya modificados.Regresin
Variables entradas/eliminadasa
ModeloVariables introducidasVariables eliminadasMtodo
1longitud de la estacion, latitudb.Intro
a. Variable dependiente: temperatura en F
b. Todas las variables solicitadas introducidas.
Resumen del modelob
ModeloRR cuadradoR cuadrado ajustadoError estndar de la estimacinDurbin-Watson
1,991a,981,9751,0613,000
a. Predictores: (Constante), longitud de la estacion, latitud
b. Variable dependiente: temperatura en F
ANOVAa
ModeloSuma de cuadradosglMedia cuadrticaFSig.
1Regresin351,4672175,733156,080,000b
Residuo6,75661,126
Total358,2228
a. Variable dependiente: temperatura en F
b. Predictores: (Constante), longitud de la estacion, latitud
Coeficientesa
ModeloCoeficientes no estandarizadosCoeficientes estandarizadostSig.Estadsticas de colinealidad
BError estndarBetaToleranciaVIF
1(Constante)191,46111,34216,881,000
latitud-2,136,162-,793-13,215,000,8741,144
longitud de la estacion-,757,121-,376-6,267,001,8741,144
a. Variable dependiente: temperatura en F
Diagnsticos de colinealidada
ModeloDimensinAutovalorndice de condicinProporciones de varianza
(Constante)latitudlongitud de la estacion
112,9961,000,00,00,00
2,00330,070,06,97,03
3,00079,407,94,03,97
a. Variable dependiente: temperatura en F
Estadsticas de residuosa
MnimoMximoMediaDesviacin estndarN
Valor pronosticado39,6059,9348,566,6289
Residuo-1,5951,377,000,9199
Valor pronosticado estndar-1,3521,716,0001,0009
Residuo estndar-1,5041,297,000,8669
a. Variable dependiente: temperatura en F
Con la eliminacin de la variable altitud en pies encontramos que tenemos un Durbin Watson bajo (3) y la inflacin de la varianza disminuy considerablemente a 1.44, es as que se puede realizar el respectivo pronstico con los datos modificados.
PROBLEMA N 12
Tasa de respiracinPotasioZinc
713882414
5325810693
5529211682
4820512560
694492464
843312607
2111416205
685802005
686221825
Regresin
Variables entradas/eliminadasa
ModeloVariables introducidasVariables eliminadasMtodo
1zinc, potasiob.Intro
a. Variable dependiente: tasa de respiracion
b. Todas las variables solicitadas introducidas.
Resumen del modelob
ModeloRR cuadradoR cuadrado ajustadoError estndar de la estimacinDurbin-Watson
1,921a,848,7988,1722,109
a. Predictores: (Constante), zinc, potasio
b. Variable dependiente: tasa de respiracion
ANOVAa
ModeloSuma de cuadradosglMedia cuadrticaFSig.
1Regresin2243,29921121,64916,795,003b
Residuo400,701666,784
Total2644,0008
a. Variable dependiente: tasa de respiracion
b. Predictores: (Constante), zinc, potasio
Coeficientesa
ModeloCoeficientes no estandarizadosCoeficientes estandarizadostSig.Estadsticas de colinealidad
BError estndarBetaToleranciaVIF
1(Constante)101,08818,8665,358,002
potasio-,040,034-,373-1,178,283,2523,970
zinc-,004,001-1,225-3,867,008,2523,970
a. Variable dependiente: tasa de respiracion
Diagnsticos de colinealidada
ModeloDimensinAutovalorndice de condicinProporciones de varianza
(Constante)potasiozinc
112,4861,000,00,01,01
2,5012,227,00,03,12
3,01214,1461,00,96,87
a. Variable dependiente: tasa de respiracion
Estadsticas de residuosa
MnimoMximoMediaDesviacin estndarN
Valor pronosticado33,6777,6359,6716,7469
Residuo-12,66510,981,0007,0779
Valor pronosticado estndar-1,5531,073,0001,0009
Residuo estndar-1,5501,344,000,8669
a. Variable dependiente: tasa de respiracion
Correlaciones
tasa de respiracionpotasiozinc
tasa de respiracionCorrelacin de Pearson1,686*-,902**
Sig. (bilateral),041,001
N999
potasioCorrelacin de Pearson,686*1-,865**
Sig. (bilateral),041,003
N999
zincCorrelacin de Pearson-,902**-,865**1
Sig. (bilateral),001,003
N999
*. La correlacin es significativa en el nivel 0,05 (2 colas).
**. La correlacin es significativa en el nivel 0,01 (2 colas).
Notamos que los valores del nivel de significacin (0.3%), el Durbin Watson (2.109) y la inflacin de la varianza (3.970) son bajos, es decir estn dentro de sus respectivos rangos para poder realizar el pronstico.
CONCLUSIONES
La finalidad de una ecuacin de regresin es la de estimar los valores de una variable con base en los valores conocidos de la otra. Del mismo modo, una ecuacin de regresin explica los valores de una variable en trminos de otra. Es decir, se puede intuir una relacin de causa y efecto entre dos o ms variables.
En el proceso de la investigacin estadstica nos encontramos con algunos problemas en torno a la relacin de las variables, tienen una relacin dependiente y ello afecta al proceso de la investigacin.
La observacin en torno a los problemas de multicolinealidad y autocorrelacin es fundamental para realizar los pronsticos, de tal modo que si se encuentra algn problema con ello no se podrn realizar estos de forma correcta.
RECOMENDACIONES
El uso de herramientas como el SPSS es fundamental para realizar los clculos de manera eficiente y segura, con ello podremos obtener resultados que nos ayudan a obtener los pronsticos deseados.
Se debe verificar los datos que arroja el SPSS, verificar que el Durbin Watson no excede a las 4 unidades, caso contrario estaramos incurriendo en un problema de autocorrelacin, tambin verificar la inflacin de la varianza conocido como VIF, la cual debe ser mximo hasta 5 unidades y as evitaremos incurrir en problemas de multicolinealidad.
Ante un problema de multicolinealidad o de autocorrelacin, se recomienda eliminar una variable (la que tiene menor valor) con el anlisis respectivo, para cada problema; con ello podremos realizar nuestros pronsticos sin problemas.
BIBLIOGRAFA
Jhon E. Freund. 2000 Estadstica matemtica con aplicaciones 6ta edicin. Levine M. David, 2006. Estadstica para Administracin 4ta edicin, edit. Person. Thomas A. Williams, 2008. Estadstica para administracin y economa 10ma edicin. http://www.psicothema.com/pdf/181.pdf http://www.ugr.es/~romansg/material http://www.uv.es/uriel/material/multicolinealidad3.pdf