2612Febrer2010Sol.pdf

8
EXAMEN D’INTRODUCCIÓ A L’ECONOMETRIA. CONVOCATÒRIA FEBRER 2010 La durada de l’examen és de 2h i 30min. Si no se diu res utilitza un nivell de significació del 5%. EXERCICI 1 (6 punts) Amb l’objectiu d’analitzar els factors determinants de la despesa que realitzen els turistes que visiten les Illes Balears s’ha estimat un model de regressió amb les següents variables: Variable dependent: despesa total per persona i dia (Di). Variables explicatives: - Dies d’estada (Ei). - Nombre de persones del grup amb que es viatja (Pi). - Nombre de vegades que s’han visitat les Illes en els darrers tres anys (Vi). - Nivell de satisfacció global amb les vacances mesurat d’1 a 10 (SGi). - Nivell de satisfacció amb les platjes mesurat d’1 a 10 (SPi). - Nivell de satisfacció amb els allotjamets mesurat d’1 a 10 (SAi). Els resultats de l’estimació d’aquest model per mínims quadrats ordinaris son els que se presenten a continuació: Resumen del modelo Modelo R R cuadrado R cuadrado corregida Error típ. de la estimación 1 ,570 ,324 ,321 19,57227 ANOVA Modelo Suma de cuadrados gl Media cuadrática F Sig. Regresión 205332,362 6 34222,060 89,335 ,000 Residual 427510,210 1116 383,074 1 Total 632842,572 1122 Coeficientes Modelo B Error típ. t Sig. FIV 1 (Constante) 91,598 3,095 29,599 ,000 E -3,012 ,173 -17,436 ,000 1,099 P -5,199 ,501 -10,369 ,000 1,064 V 1,341 ,474 2,831 ,005 1,032 SG ,809 ,417 1,941 ,052 1,698 SP -,178 ,316 -,564 ,573 1,302 SA -,147 ,297 -,496 ,620 1,518

Transcript of 2612Febrer2010Sol.pdf

Page 1: 2612Febrer2010Sol.pdf

EXAMEN D’INTRODUCCIÓ A L’ECONOMETRIA. CONVOCATÒRIA FEBRER 2010 La durada de l’examen és de 2h i 30min. Si no se diu res utilitza un nivell de significació del 5%. EXERCICI 1 (6 punts) Amb l’objectiu d’analitzar els factors determinants de la despesa que realitzen els turistes que visiten les Illes Balears s’ha estimat un model de regressió amb les següents variables: Variable dependent: despesa total per persona i dia (Di). Variables explicatives:

- Dies d’estada (Ei). - Nombre de persones del grup amb que es viatja (Pi). - Nombre de vegades que s’han visitat les Illes en els darrers tres anys (Vi). - Nivell de satisfacció global amb les vacances mesurat d’1 a 10 (SGi). - Nivell de satisfacció amb les platjes mesurat d’1 a 10 (SPi). - Nivell de satisfacció amb els allotjamets mesurat d’1 a 10 (SAi).

Els resultats de l’estimació d’aquest model per mínims quadrats ordinaris son els que se presenten a continuació: Resumen del modelo

Modelo R R cuadrado R cuadrado corregida

Error típ. de la estimación

1 ,570 ,324 ,321 19,57227 ANOVA

Modelo Suma de

cuadrados gl Media

cuadrática F Sig. Regresión 205332,362 6 34222,060 89,335 ,000 Residual 427510,210 1116 383,074

1

Total 632842,572 1122 Coeficientes

Modelo B Error típ. t Sig. FIV 1 (Constante) 91,598 3,095 29,599 ,000 E -3,012 ,173 -17,436 ,000 1,099 P -5,199 ,501 -10,369 ,000 1,064 V 1,341 ,474 2,831 ,005 1,032 SG ,809 ,417 1,941 ,052 1,698 SP -,178 ,316 -,564 ,573 1,302 SA -,147 ,297 -,496 ,620 1,518

Page 2: 2612Febrer2010Sol.pdf

a) Emplena les caselles sombrejades. b) Interpreta els resultats del model (bondat d’ajust, significació conjunta, significació

individual, coeficients). c) Calcula un interval de confiança per a l’efecte marginal del nombre de visites sobre la

despesa. d) Contrasta la hipòtesi de que l’efecte marginal del nombre de visites sobre la despesa és

igual a la unitat. Quina seria la potència d’aquest contrast si el nombre de visites no fos una variable significativa per a explicar la despesa?

e) Quin model alternatiu hauries d’estimar per a contrastar la hipòtesis de que l’efecte marginal sobre la despesa d’estar un dia més de vacances és el mateix que el de viatjar amb una persona més? Escriu la seva equació i indica com faries el contrast.

f) S’ha estimat un model alternatiu per mínims quadrats ordinaris, i els resultats son els següents: Resumen del modelo

Modelo R R cuadrado R cuadrado corregida

Error típ. de la estimación

2 ,569 ,324 ,322 19,56019 ANOVA

Modelo Suma de

cuadrados gl Media

cuadrática F Sig. Regresión 205094,585 4 51273,646 134,013 ,000 Residual 427747,987 1118 382,601

2

Total 632842,572 1122 Coeficientes

Modelo B Error típ. t Sig. FIV 2 (Constante) 90,901 2,909 31,251 ,000 E -3,024 ,172 -17,612 ,000 1,087 P -5,212 ,501 -10,409 ,000 1,063 V 1,332 ,472 2,825 ,005 1,025 SG ,603 ,321 1,881 ,060 1,007

Comenta els resultats d’aquest segon model i indica quin dels dos models triaries per explicar el comportament de la despesa, el model 1 o el 2. Justifica la teva resposta amb les mesures estadístiques adients i el contrast corresponent.

Page 3: 2612Febrer2010Sol.pdf

EXERCICI 2 (2 punts) La funció de probabilitat d’una variable amb distribució de Poisson és:

( ) λλ −= ex

xfx

! x = 0, 1, 2, 3,...

A partir de les propietats que tindria MVλ̂ , com a estimador de màxima versemblança, obté: a) L’expressió per a un interval de confiança asimptòtic per al paràmetre λ . b) L’expressió per a un estadístic de contrast per a contrastar hipòtesis del tipus 00 : λλ =H ,

baix el supòsit que es disposa d’una mostra gran. EXERCICI 3 (2 punts) Amb l’objectiu de comparar les característiques del comportament de la despesa turística per persona i dia del turistes que visitaren les Illes Balears l’estiu passat, en funció de si s’allotjaren en hotel o a un altre tipus d’allotjament, s’ha realitzant la següent anàlisis: Prueba F para varianzas de dos muestras

Hotel Otros alojamientos Media 62,68282473 53,69486702Varianza 567,1881864 498,8151755Observaciones 889 297Grados de libertad 888 296F 1,137070832 P(F<=f) una cola 0,093046741 Valor crítico para F (una cola) 1,1733499

a) Digués quina és l’anàlisi estadística que se presenta. Comenta els resultats. b) A partir de les dades de la taula realitza el contrast corresponent per a contrastar si la

despesa per persona i dia mitjana és igual pels turistes que s’allotjaren a hotel i els que triaren un altre allotjament. Suposa que la despesa per persona i dia és una variable que se distribueix normalment a ambdós grups.

Page 4: 2612Febrer2010Sol.pdf

SOLUCIONS EXERCICI 1 Resumen del modelo

Modelo R R cuadrado R cuadrado corregida

Error típ. de la estimación

1 ,570 ,324 ,321 19,57227 ANOVA

Modelo Suma de

cuadrados gl Media

cuadrática F Sig. Regresión 205332,362 6 34222,060 89,335 ,000 Residual 427510,210 1116 383,074

1

Total 632842,572 1122 Coeficientes

Modelo B Error típ. t Sig. FIV 1 (Constante) 91,598 3,095 29,599 ,000 E -3,012 ,173 -17,436 ,000 1,099 P -5,199 ,501 -10,369 ,000 1,064 V 1,341 ,474 2,831 ,005 1,032 SG ,809 ,417 1,941 ,052 1,698 SP -,178 ,316 -,564 ,573 1,302 SA -,147 ,297 -,496 ,620 1,518

g) ( ) ( ) 321.011161122324.011111 22 =−−=

−−

−−=kn

nRR

Error típic de l’estimació (EER) = 57.191116

210.427510ˆ2 ==−

=kn

VRSR

VT = VE + VR = 632842,572 Graus de lliberta de la VE: k-1 = 7 – 1 = 6 Graus de llibertat de la VR: n-k = (1122+1) – 7 = 1116 Mitjanes quadràtiques: VE/(k-1) = 34222,060 i VR/(n-k) = 383,074 = 2ˆ

RS

335.89k)-VR/(n

1)-VE/(k==F

Error típic de 4β̂ : ( ) 474.0831.2341.1ˆˆ 4

4 ===t

es ββ

t-ratio de ( ) 941.1417.0809.0

ˆˆˆ

5

55 ===

βββ

es

Page 5: 2612Febrer2010Sol.pdf

h) Bondat d’ajust: el coeficient de determinació és 0.324, per tant, un 32.4% de les variacions mostrals de la despesa estan explicades per les variacions mostrals de les variables explicatives incloses en el model. Significació conjunta: la hipòtesi nul·la de que totes les variables explicatives incloses en el model son no significatives ( 0: 7654320 ====== ββββββH ) es rebutja, ja que el p-valor del contrast F que apareix a la taula ANOVA és 0.000 (< 0.05). Per tant, alguna/es variable/s és/son significativa/es. Significació individual: les variables E, P i V son significatives al 5%, ja que el p-valor del contrast t de significació individual és inferior a 0.05. La variable SG no és significativa al 5%, però si ho seria al 6%. Les variables SP i SA no son significatives ja que el p-valor del contrast de significació és elevat (> 0.05). Coeficients: les estimacions dels coeficients del model mostres que les variables E, P, SP i SA tenen un efecte negatiu sobre la despesa, mentre que les variables V i SG influeixen positivament sobre la despesa. Els FIVs de tots els coeficients son propers a 1, per tant, no hi ha cap variable que generi problemes de multicolinealitat en el model.

i) ( ) [ ] [ ]0,41;2,27474.096.1341.14%95 =⋅±=βIC j) 1: 40 =βH

1: 4 ≠βAH

( )Hocertaes

t4

4

ˆ1ˆ

ββ −

= ∼ knt −

( ) 0,719474.0

1341.1ˆ

4

4 =−

=−

βes

t < 025.01116t ⇒ NRHo

Potència si el nombre de visites no fos una variable significativa per a explicar la despesa: Rho si: 1,929474.096.11ˆ

4 =⋅+>β o 0,071474.096.11ˆ4 =⋅−<β

( ) ( ) 0,5600,1504,070474.0

0071.0474.0

0929.1

0071.0ˆ

0929.1ˆ

0

1116111611161116

4

4

4

4

4

=<+>=⎟⎠⎞

⎜⎝⎛ −

<+⎟⎠⎞

⎜⎝⎛ −

>

=⎟⎟⎠

⎞⎜⎜⎝

⎛=

<+⎟⎟⎠

⎞⎜⎜⎝

⎛=

>==

tPtPtPtP

PPPotβ

ββ

ββ

k) 320 : ββ =H

32: ββ ≠AH Model ampliat:

iiiiiiii uSASPSGVPED +++++++= 7654321 βββββββ Model restringit:

( ) iiiiiiii uSASPSGVPED +++++++= 765431 ββββββ Procediment: 1) Construir la nova variable ( )ii PE + a partir de les dades de les variables Ei i Pi. 2) Estimar el model restringit. 3) Utilitzant els valors de les variacions residuals del model ampliat i restringit, calcular

l’estadístic F:

Page 6: 2612Febrer2010Sol.pdf

( )HocertaknVRa

VRaVRrF)/(1/

−−

= ∼ ( )knF −,1

El contrast és unilateral per la dreta. Per tant, si el valor de l’estadístic F és major al valor de les taules de la F, es Rho i, per tant, preferim el model ampliat. En cas contrari, NRHo i preferim el model restringit.

l) Resumen del modelo

Modelo R R cuadrado R cuadrado corregida

Error típ. de la estimación

2 ,569 ,324 ,322 19,56019 ANOVA

Modelo Suma de

cuadrados gl Media

cuadrática F Sig. Regresión 205094,585 4 51273,646 134,013 ,000 Residual 427747,987 1118 382,601

2

Total 632842,572 1122 Coeficientes

Modelo B Error típ. t Sig. FIV 2 (Constante) 90,901 2,909 31,251 ,000 E -3,024 ,172 -17,612 ,000 1,087 P -5,212 ,501 -10,409 ,000 1,063 V 1,332 ,472 2,825 ,005 1,025 SG ,603 ,321 1,881 ,060 1,007

Bondat d’ajust: el coeficient de determinació és 0.324, per tant, un 32.4% de les variacions mostrals de la despesa estan explicades per les variacions mostrals de les variables explicatives incloses en el model. Significació conjunta: la hipòtesi nul·la de que totes les variables explicatives incloses en el model son no significatives ( 0: 7654320 ====== ββββββH ) es rebutja, ja que el p-valor del contrast F que apareix a la taula ANOVA és 0.000 (< 0.05). Per tant, alguna/es variable/s és/son significativa/es. Significació individual: les variables E, P i V son significatives al 5%, ja que el p-valor del contrast t de significació individual és inferior a 0.05. La variable SG no és significativa al 5%, però si ho seria al 7%. Coeficients: les estimacions dels coeficients del model mostres que les variables E i P, tenen un efecte negatiu sobre la despesa, mentre que les variables V i SG influeixen positivament sobre la despesa. Els FIVs de tots els coeficients son propers a 1, per tant, no hi ha cap variable que generi problemes de multicolinealitat en el model.

Page 7: 2612Febrer2010Sol.pdf

Comparació dels models 1 i 2: - 21 RR < ⇒ Millor model 2. - EER1 > EER2 ⇒ Millor model 2. - Contrast de nul·litat d’un subconjunt de paràmetres:

0: 760 == ββH 0lg: ≠jA unAH β

( )HocertaknVRa

VRaVRrF)/(2/

−−

= ∼ ( )knF −,2

( ) 0,310)1116/(427510,210

2/427510,210987.427747=

−=F < ( )

05,01116,2F =3,004

⇒ NRHo ⇒ Preferim el model restringit (model 2).

EXERCICI 2

c) ( )( )MVMV asN λλλ ˆvar,ˆ → ⇒ ( ) ( )⎥⎦⎤⎢⎣⎡ ±= MVMV asZIC λλλ ˆvarˆ

025,0%95

( )1

ˆ2

2 logˆvar

= ⎥⎥⎦

⎢⎢⎣

∂−∂

−=MV

las MVλλλ

λ

λλλ λ nyyey

l iii

yi

−−=⎟⎟⎠

⎞⎜⎜⎝

⎛=− ∑∑∑ − !lnln

!lnlog

ny

nyl i

MVi ∑∑ =⇒−=

∂−∂ λ

λλˆlog

22

2 logλλ∑−=

∂−∂ iyl

MVMV

MV nnl

MVλλ

λλ λλ

ˆˆˆlog

2

2

==∂

−∂−

=

⇒ ( )n

as MVMV

λλ

ˆˆvar =

( )⎥⎥⎦

⎢⎢⎣

⎡±=

nZIC MV

MVλ

λλˆ

ˆ025,0%95

d) 00 : λλ =H

( )( )MVMV asN λλλ ˆvar,ˆ → ⇒ ( )( )MVHocertaMV asN λλλ ˆvar,ˆ0→ ⇒ ( )1,0

ˆ

ˆ0 N

n Hocerta

MV

MV →−

λ

λλ

Page 8: 2612Febrer2010Sol.pdf

EXERCICI 3 Prueba F para varianzas de dos muestras

Hotel Otros alojamientos Media 62,68282473 53,69486702Varianza 567,1881864 498,8151755Observaciones 889 297Grados de libertad 888 296F 1,137070832 P(F<=f) una cola 0,093046741 Valor crítico para F (una cola) 1,1733499

c) A la taula es presenten els resultats d’un contrast d’igualtat de variàncies de les

distribucions de la despesa per als turistes que s’allotgen a hotel i els que ho fan a altres allotjaments.

220 : AHH σσ =

22: AHAH σσ > No es rebutja la Ho, ja que el p-valor del contrast és major que el nivell de significació (0,093046741 > 0.05).

d) AHH µµ =:0

AHAH µµ ≠:

HocertaAHT

AH

nnS

yyt

⎟⎟⎠

⎞⎜⎜⎝

⎛+

−=

11ˆ 2

∼ 2−+ AH nnt

72,5

2971

8891

2297889296815,498888188,56769,5368,62

=

⎟⎠⎞

⎜⎝⎛ +

−+⋅+⋅

−=t > 96,1025,0

1184 =t ⇒ Rho ⇒ Les

mitjanes son diferents.