Ejercicios resueltos Inferencia Estadistica

29
1 EJERCICIOS DE APLICACIÓN ESTADISTICA INFERENCIAL I. Los salarios percibidos por un grupo de empleados de una empresa, el mes recién pasado, se resumen en archivo1 de Excel, que se adjunta. Se requiere tabular la información utilizando seis (6) intervalos de clases de la misma amplitud, con el objeto de verificar se estos salarios se ajustan a un modelo de probabilidad normal. 1. a) Para realizar el contraste de bondad de ajuste, se decide probar los métodos de contrastes, todos al nivel 5%: Contraste Ji – cuadrado/ Kolmgorov – Liliefords/ Asimetría / Curtosis / Jarque-Bera b) Diseñar la tabla de frecuencias apropiada para el (los) contraste (s) c) Dibujar un histograma (o un polígono) de frecuencias para verificar la tendencia a la distribución normal d) Estimar los parámetros de la distribución normal e) Formular el contraste de bondad de ajuste f) Realizar el contraste, con todos los test de bondad de ajuste g) Concluir si efectivamente la variable se ajusta al modelo formulado en la hipótesis nula. 2. Son ingresos tipo A cuando éste está bajo el primer quintil. Son ingresos tipo B cuando éste se ubica desde el segundo quintil hasta el cuarto quintil y son ingresos tipo C cuando éste se ubica sobre el cuarto quintil. a) Determine si existe asociación entre el género del empleado y el tipo de ingreso. 3. Determine si la proporción de varones es superior en el grupo de los más jóvenes respecto del grupo de mayor edad. 4. Realizar un análisis del ingreso según tramos de edad que responda a las dos siguientes hipótesis: a) El ingreso promedio de los varones es de al menos 820 mil b) El ingreso promedio de los varones en nada se diferencia del ingreso medio de las mujeres. II. LAS SIGUIENTES PREGUNTAS SE CONTESTAN SEGÚN LOS DATOS DEL ARCHIVO2. 1.- Analice si es posible utilizar un modelo de regresión lineal que permite estimar la cantidad de energía generada a partir de la velocidad del viento para cada condición climática. 2.- Para cada condición climática analice si la contribución marginal de la velocidad del viento en la generación de energía es del orden de 3 KW/(Km/h).

description

Ejercicios Resueltos estadística inferencia:Test de normalidad;Kolmogorov SmirnovCurtosisAsimetríaJarque-BeraJiRegresión LinealDócimas de hipótesisUna y dos poblaciones

Transcript of Ejercicios resueltos Inferencia Estadistica

Page 1: Ejercicios resueltos Inferencia Estadistica

1

EJERCICIOS DE APLICACIÓN ESTADISTICA INFERENCIAL

I. Los salarios percibidos por un grupo de empleados de una empresa, el mes recién pasado, se resumen en archivo1 de Excel, que se adjunta. Se requiere tabular la información utilizando seis (6) intervalos de clases de la misma amplitud, con el objeto de verificar se estos salarios se ajustan a un modelo de probabilidad normal.

1. a) Para realizar el contraste de bondad de ajuste, se decide probar los métodos de contrastes,

todos al nivel 5%: Contraste Ji – cuadrado/ Kolmgorov – Liliefords/ Asimetría / Curtosis / Jarque-Bera

b) Diseñar la tabla de frecuencias apropiada para el (los) contraste (s) c) Dibujar un histograma (o un polígono) de frecuencias para verificar la tendencia a la

distribución normal d) Estimar los parámetros de la distribución normal e) Formular el contraste de bondad de ajuste f) Realizar el contraste, con todos los test de bondad de ajuste g) Concluir si efectivamente la variable se ajusta al modelo formulado en la hipótesis nula.

2. Son ingresos tipo A cuando éste está bajo el primer quintil. Son ingresos tipo B cuando éste se

ubica desde el segundo quintil hasta el cuarto quintil y son ingresos tipo C cuando éste se ubica sobre el cuarto quintil. a) Determine si existe asociación entre el género del empleado y el tipo de ingreso.

3. Determine si la proporción de varones es superior en el grupo de los más jóvenes respecto del

grupo de mayor edad.

4. Realizar un análisis del ingreso según tramos de edad que responda a las dos siguientes hipótesis:

a) El ingreso promedio de los varones es de al menos 820 mil b) El ingreso promedio de los varones en nada se diferencia del ingreso medio de las mujeres.

II. LAS SIGUIENTES PREGUNTAS SE CONTESTAN SEGÚN LOS DATOS DEL ARCHIVO2.

1.- Analice si es posible utilizar un modelo de regresión lineal que permite estimar la cantidad de

energía generada a partir de la velocidad del viento para cada condición climática.

2.- Para cada condición climática analice si la contribución marginal de la velocidad del viento en la

generación de energía es del orden de 3 KW/(Km/h).

Page 2: Ejercicios resueltos Inferencia Estadistica

2

I. ARCHIVO 1 1.

TEST DE KOLMGOROV – LILIEFORDS

Previo a esto es necesario definir la variable de estudio:

X: Los salarios percibidos por un grupo de empleados de una empresa (en miles de pesos)

a) Tabla 1.1

b) Gráfica 1.1

1 Límite inferior del intervalo 2 Límite superior del intervalo 3 FO: Frecuencia observada 4 FOR: Frecuencia relativa 5 FOR ACUM o FORA: Frecuencia relativa acumulada 6 FER ACUM o FERA; Valor esperado de la distribución normal 7 ABS(FORA-FERA): Valor absoluto de la diferencia de FORA y FERA

4

41

165179

96

15

0

20

40

60

80

100

120

140

160

180

200

661,47 – 711,25 711,25 – 761,03 761,03 – 810,81 810,81– 860,59 860,59 – 910,37 910,37 – 960,15

Frecuencia por intervalo

INTERVALOS LIM INF1 LIM SUP2 FO3 FOR4 FOR ACUM5 FER ACUM6 ABS(FORA-FERA)7

1 661,470 711,250 4 0,008 0,008 0,00899871 0,000998708

2 711,250 761,030 41 0,082 0,09 0,09440335 0,004403354

3 761,030 810,810 165 0,33 0,42 0,39644353 0,023556469

4 810,810 860,590 179 0,358 0,778 0,7849412 0,006941204

5 860,590 910,370 96 0,192 0,97 0,96715582 0,002844179

6 910,370 960,150 15 0,03 1 0,99808661 0,001913391

TOTAL 500 1

Page 3: Ejercicios resueltos Inferencia Estadistica

3

c) A partir de la muestra se obtienen los siguientes datos:

Tabla 1.2

Promedio de la muestra 823,240

Desviación estándar de la muestra 47,33946546

Número de datos 500

d) Prueba de hipótesis

Ho: La muestra procede de una población que se distribuye normal H1: La muestra no procede de una población que se distribuye normal

e) Tabla 1.3

ESTIMADOR KOSMOGOROV

Dn8 0,023556469

Dn Tabla9 0,039623125

Decisión No se rechaza Ho

CONCLUSIÓN: Para un nivel de significancia del 5% y dada la evidencia muestral, es altamente

probable que la muestra proceda de una población que distribuya normal.

8 Para calcular el valor Dn se utilizó el valor máximo de la columna ABS(FORA-FERA) de la tabla 1.1

9 El valor Dn Tabla es el valor 0,886√500

⁄ (muestras n>30) correspondiente a la tabla 9 [de los materiales

de clase (corrección de Lilliefors para Normalidad] ya que la media y la varianza no fueron dadas

Page 4: Ejercicios resueltos Inferencia Estadistica

4

ASIMETRÍA

Definiendo la variable de estudio:

X: Los salarios percibidos por un grupo de empleados de una empresa (en miles de pesos)

Tabla 2.1

Ho: Los salarios percibidos por los empleados provienen de una distribución normal H1: Los salarios percibidos por los empleados no provienen de una distribución normal Es preciso definir el coeficiente de asimetría y utilizar un nivel de significancia del 5%:

�̂�1 =𝑚3

𝑚2

32⁄

; 𝑚3 =(𝑥𝑖−�̅�)3

𝑛; 𝑚2 =

(𝑥𝑖−�̅�)2

𝑛

𝑚3 = −4205,1081

𝑚2 = 2236,54294

�̂�1 = −0,03975679

𝑍𝑜𝑏𝑠 =�̂�1

√6

𝑛

= −0,36292817

𝑍1−𝛼 =1,645

𝐶𝑜𝑚𝑜; 𝑍𝑜𝑏𝑠 < 𝑍1−𝛼; 𝐻𝑜 𝑑𝑒𝑏𝑒 𝑠𝑒𝑟 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑑𝑎

Conclusión:

Para un nivel de significancia del 5% y dada la evidencia muestral es altamente probable

que los datos provengan de una población normal

Promedio de la muestra 823,2396141

Desviación estándar de la muestra 47,33946546 Número de datos 500

Page 5: Ejercicios resueltos Inferencia Estadistica

5

CURTOSIS

Definiendo la variable de estudio:

X: Los salarios percibidos por un grupo de empleados de una empresa (en miles de pesos)

Tabla 3.1

Ho: Los salarios percibidos por los empleados provienen de una distribución normal H1: Los salarios percibidos por los empleados no provienen de una distribución normal Es preciso definir el coeficiente de curtosis y utilizar un nivel de significancia del 5%:

�̂�2 =𝑚4

𝑚22

− 3; 𝑚2 =(𝑥𝑖−�̅�)2

𝑛; 𝑚4 =

(𝑥𝑖−�̅�)4

𝑛

𝑚4 = 13901771,06

𝑚2 = 2236,54294

�̂�2 = −0,22082656

𝑍𝑜𝑏𝑠 = |�̂�2

√24

𝑛

| = 1,00793074

𝑍1−𝛼 =1,645

𝐶𝑜𝑚𝑜; 𝑍𝑜𝑏𝑠 < 𝑍1−𝛼; 𝐻𝑜 𝑑𝑒𝑏𝑒 𝑠𝑒𝑟 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑑𝑎

Conclusión:

Para un nivel de significancia del 5% y dada la evidencia muestral es altamente probable

que los datos provengan de una población normal

Promedio de la muestra 823,2396141

Desviación estándar de la muestra 47,33946546 Número de datos 500

Page 6: Ejercicios resueltos Inferencia Estadistica

6

JARQUE-BERA Definiendo la variable de estudio: X: Los salarios percibidos por un grupo de empleados de una empresa (en miles de pesos) Tabla 4.1

Ho: Los salarios percibidos por los empleados provienen de una distribución normal H1: Los salarios percibidos por los empleados no provienen de una distribución normal Es preciso definir el coeficiente de asimetría y curtosis, utilizar un nivel de significancia del 5%:

�̂�2 =𝑚4

𝑚22

− 3; 𝑚2 =(𝑥𝑖−�̅�)2

𝑛; 𝑚4 =

(𝑥𝑖−�̅�)4

𝑛

�̂�1 =𝑚3

𝑚2

32⁄

; 𝑚3 =(𝑥𝑖−�̅�)3

𝑛; 𝑚2 =

(𝑥𝑖−�̅�)2

𝑛

𝑚4 = 13901771,06 𝑚3 = −4205,1081

𝑚2 = 2236,54294 𝑚2 = 2236,54294

�̂�2 = −0,22082656 �̂�1 = −0,03975679

El estadístico de prueba de Jarque-Bera se define:

𝐵 = 𝑛 [�̂�1

2

6+

�̂�22

24] = 1,147641238

𝑋2𝑜𝑏𝑠 = 5,99146455

𝐵 < 𝑋2𝑜𝑏𝑠; 𝐻𝑜 𝑠𝑒𝑟á 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑑𝑎

Conclusión:

Para un nivel de significancia del 5% y dada la evidencia muestral es altamente probable

que los datos provengan de una población normal

Promedio de la muestra 823,2396141

Desviación estándar de la muestra 47,33946546 Número de datos 500

Page 7: Ejercicios resueltos Inferencia Estadistica

7

JI- BONDAD DE AJUSTE

Previo a esto es necesario definir la variable de estudio:

X: Los salarios percibidos por un grupo de empleados de una empresa (en miles de pesos)

a) Tabla 5.1

INTERVALOS LIM INF LIM SUP n Pi Ei

1 661,470 721,206 7 0,016 8

2 721,206 780,942 89 0,170 85

3 780,942 840,678 223 0,458 229

4 840,678 900,414 159 0,305 152

510 900,414 960,150 22 0,052 26

TOTAL 500 1 500

b) A partir de la muestra se obtienen los siguientes datos:

Tabla 5.2

Promedio de la muestra 823,240

Desviación estándar de la muestra

47,33946546

Número de datos 500

∑(𝒏𝒊 − 𝑬𝒊)𝟐

𝑬𝒊

1,24764539

c) La hipótesis Ho: La muestra procede de una población que se distribuye normal H1: La muestra no procede de una población que se distribuye normal

10 Se utilizan 5 intervalos en vez de 6, ya que si se utilizaban 6 el primer intervalo tenía un valor Ei<5

7

89

223

159

22

0

50

100

150

200

250

661,47 - 721,206 721,206 - 780,942 780,942 - 840,678 840,678 - 900,414 900,414 - 960,15

Frecuencia

Frecuencia

Page 8: Ejercicios resueltos Inferencia Estadistica

8

d)

𝑾 =∑(𝑛𝑖 − 𝐸𝑖)2

𝐸𝑖= 1,24764539

e) 𝑋2

𝑜𝑏𝑠(5 − 1 − 2) = 5,991 Ya que

𝑾 < 𝑋2𝑜𝑏𝑠

𝐻𝑜 no se rechaza

CONCLUSIÓN: Para un nivel de significancia del 5% y dada la evidencia muestral es

altamente probable que los datos provengan de una población normal

Page 9: Ejercicios resueltos Inferencia Estadistica

9

2.

a) TEST DE INDEPENDENCIA

Datos tabulados por quintil y por tipo de ingreso

Ho: El salario no depende del sexo H1: El salario si depende del sexo

LIM INF LIM SUP

I Quintil 661,470 781,927

II Quintil 782,256 808,414

III Quintil 808,585 836,328

IV Quintil 836,435 864,398

V Quintil 864,586 960,150

MUJERES HOMBRES

TIPO A 0 100 100

TIPO B 200 100 300

TIPO C 0 100 100

200 300

Tabla de frecuencias esperadas

MUJERES HOMBRES

TIPO A 40 60 100

TIPO B 120 180 300

TIPO C 40 60 100

200 300 500

Estadístico W

𝑊11 = ∑(𝑂𝑖 − 𝐸𝑖)2

𝐸𝑖= 222,222

A un nivel de significancia del 5%, el valor de

𝑋2𝑜𝑏𝑠((2 − 1) × (3 − 1)) = 𝑋2

𝑜𝑏𝑠(2; 0,95) Como

𝑊 > 𝑋2𝑜𝑏𝑠

Ho será rechazada CONCLUSIÓN: Para un nivel de significancia del 5%, con la evidencia muestra con la que se cuenta es posible decir que el ingreso en esta empresa depende del sexo.

11 𝑶𝒊 :Valor observado de la muestra

𝑬𝒊: Frecuencia esperada

Page 10: Ejercicios resueltos Inferencia Estadistica

10

3.

o X: Salario de empleados de una empresa o 𝑝𝑥: Porcentaje de hombres en el grupo de edad más joven o 𝑞𝑥: Porcentaje de mujeres en el grupo de edad más joven o 𝑝𝑦: Porcentaje de hombres en el grupo de mayor edad

o 𝑞𝑦: Porcentaje de mujeres en el grupo de mayor edad

(1°) LA HIPÓTESIS: Ho: 𝑝𝑥 − 𝑝𝑦 ≤ 0

H1: 𝑝𝑥 − 𝑝𝑦 > 0

(2°) LA REGION DE RECHAZO: Con 𝜶 = 0,05 RR: [1,645; ∞+) RNR: (−∞; 1,645[ (3°) Z OBSERVADO:

𝑍𝑂𝐵𝑆 =�̂�𝑥 − �̂�𝑦

√�̂�𝑐 × �̂�𝑐

𝑛𝑥+

�̂�𝑐 × �̂�𝑐𝑛𝑦

= 0

(4°) DECISIÓN: Ya que 0 ∈ RNR: (−∞; 1,645[ Ho no se rechaza (5°) CONCLUSIÓN: Con un nivel de significancia del 5%, con la evidencia muestral que se presenta, es altamente probable que el porcentaje de varones en el grupo de mayor edad supere o iguale al porcentaje de hombres en el tramo más joven de la empresa.

�̂�𝒙 0,4

�̂�𝒙 0,6

�̂�𝒚 0,4

�̂�𝒚 0,6

�̂�𝒄 0,4

�̂�𝒄 0,6

𝒏𝒙 60

𝒏𝒚 330

Page 11: Ejercicios resueltos Inferencia Estadistica

11

4.

a) Definiendo las variables

X: Salario de empleados de una empresa

Entre 25 y 30 años

�̅� 810,6552286

𝑺𝑿 65,34222029

𝒏𝑿 36

(1°) LA HIPÓTESIS: Ho: 𝜇𝑥 ≥ 810 H1: 𝜇𝑥 < 810 (2°) LA REGION DE RECHAZO: Con 𝜶 = 0,05 RR: (−∞; −𝟏, 𝟔𝟗 ] RNR: ] − 𝟏, 𝟔𝟗 ; ∞+) (3°) T OBSERVADO:

𝑇𝑂𝐵𝑆 =�̅� − 𝜇0

√𝑆𝑥

2

𝑛𝑥

= 0,06

(4°) DECISIÓN:

𝒀𝒂 𝑞𝑢𝑒 0,06 ∈ 𝑹𝑵𝑹: ] − 𝟏, 𝟔𝟗 ; ∞+) Ho no se rechaza

(5°) CONCLUSIÓN: Con un nivel de significancia del 5%, con la evidencia muestral que se presenta, es altamente probable que el promedio del sueldo de los varones en el grupo de edad Entre 25 y 30 años de la empresa sea al menos 810 mil pesos

Page 12: Ejercicios resueltos Inferencia Estadistica

12

Entre 30 y 40 años

�̅� 818,5718839

𝑺𝑿 55,83101098

𝒏𝑿 66

(1°) LA HIPÓTESIS: Ho: 𝜇𝑥 ≥ 810 H1: 𝜇𝑥 < 810 (2°) LA REGION DE RECHAZO: Con 𝜶 = 0,05 RR: (−∞; −𝟏, 𝟔𝟕 ] RNR: ] − 𝟏, 𝟔𝟕 ; ∞+) (3°) T OBSERVADO:

𝑇𝑂𝐵𝑆 =�̅� − 𝜇0

√𝑆𝑥

2

𝑛𝑥

= 1,25

(4°) DECISIÓN:

Ya que 1,25 ∈ RNR: ] − 𝟏, 𝟔𝟕 ; ∞+) Ho no se rechaza

(5°) CONCLUSIÓN: Con un nivel de significancia del 5%, con la evidencia muestral que se presenta, es altamente probable que el promedio del sueldo de los varones en el grupo de edad Entre 30 y 40 años de la empresa sea al menos 810 mil pesos

Page 13: Ejercicios resueltos Inferencia Estadistica

13

Más de 40 años

�̅� 830,5063611

𝑺𝑿 55,45906017

𝒏𝑿 198

(1°) LA HIPÓTESIS: Ho: 𝜇𝑥 ≥ 810 H1: 𝜇𝑥 < 810 (2°) LA REGION DE RECHAZO: Con 𝜶 = 0,05 RR: (−∞; −𝟏, 𝟔𝟓 ] RNR: ] − 𝟏, 𝟔𝟓 ; ∞+) (3°) T OBSERVADO:

𝑇𝑂𝐵𝑆 =�̅� − 𝜇0

√𝑆𝑥

2

𝑛𝑥

= 5,20

(4°) DECISIÓN:

Ya que 5,20 ∈ RNR: ] − 𝟏, 𝟔𝟓 ; ∞+) Ho no se rechaza

(5°) CONCLUSIÓN: Con un nivel de significancia del 5%, con la evidencia muestral que se presenta, es altamente probable que el promedio del sueldo de los varones en el grupo de edad Más de 40 años de la empresa sea al menos 810 mil pesos

Page 14: Ejercicios resueltos Inferencia Estadistica

14

b)

Entre 25 y 30 años

�̅� 810,6552286

𝑺𝑿 65,34222029

𝒏𝑿 36

�̅� 813,822038

𝑺𝒀 26,70580087

𝒏𝒀 24

Primero hay que comprobar a través de una prueba igualdad de varianzas: (1°) LA HIPÓTESIS:

Ho: 𝜎𝑥

2

𝜎𝑦2 = 1

H1: 𝜎𝑥

2

𝜎𝑦2 ≠ 1

(2°) LA REGION DE RECHAZO: Con 𝜶 = 0,05 RR: (−∞; 0,48 ] ∪ [ 2,20 ; ∞+) RNR: ]0,48 ; 2,20 [ (3°) F OBSERVADO:

𝐹𝑂𝐵𝑆 =𝑆𝑥

2

𝑆𝑦2

×1

𝑘12= 5,99

(4°) DECISIÓN:

𝒀𝒂 𝑞𝑢𝑒 5,99 ∈ 𝑹𝑹: Ho se rechaza

(5°) CONCLUSIÓN: Con un nivel de significancia del 5%, con la evidencia muestral que se presenta, es altamente probable que exista diferencias entre las varianzas del primer tramo etario

12 K; es el valor que toma Ho: 𝜎𝑥

2

𝜎𝑦2 = 1, en este caso 1

Page 15: Ejercicios resueltos Inferencia Estadistica

15

Hecha la prueba es posible realizar prueba para diferencia de medias (1°) LA HIPÓTESIS: Ho: 𝜇𝑥 − 𝜇𝑦 = 0

H1: 𝜇𝑥 − 𝜇𝑦 ≠ 0

(2°) LA REGION DE RECHAZO: Con 𝜶 = 0,05 RR: (−∞; −2,01 ] ∪ [ 2,01 ; ∞+) RNR: ] − 2,01 ; 2,01 [ (3°) T OBSERVADO:

𝑇𝑂𝐵𝑆 =�̅� − �̅� − 𝑘13

√𝑆𝑋

2

𝑛𝑋+

𝑆𝑌2

𝑛𝑌

= −0,26

(4°) DECISIÓN:

𝒀𝒂 𝑞𝑢𝑒 − 0,26 ∈ 𝑹𝑵𝑹 Ho no se rechaza

(5°) CONCLUSIÓN: Con un nivel de significancia del 5%, con la evidencia muestral que se presenta, es altamente probable que el promedio del sueldo de los varones y de las mujeres en el grupo de edad Entre 25 y 30 años de la empresa no presente diferencias

13 K; es el valor que toma Ho: 𝜇𝑥 − 𝜇𝑦 = 0, en este caso 0

Page 16: Ejercicios resueltos Inferencia Estadistica

16

Entre 30 y 40 años

818,5718839

55,83101098

66

816,3727249

26,85826533

44

Primero hay que comprobar a través de una prueba igualdad de varianzas: (1°) LA HIPÓTESIS:

Ho: 𝜎𝑥

2

𝜎𝑦2 = 1

H1: 𝜎𝑥

2

𝜎𝑦2 ≠ 1

(2°) LA REGION DE RECHAZO: Con 𝜶 = 0,05 RR: (−∞; 0,59 ] ∪ [ 1,76 ; ∞+) RNR: ] 0,59 ; 1,76 [ (3°) F OBSERVADO:

𝐹𝑂𝐵𝑆 =𝑆𝑥

2

𝑆𝑦2

×1

𝑘= 4,32

(4°) DECISIÓN:

𝒀𝒂 𝑞𝑢𝑒 4,32 ∈ 𝑹𝑹: Ho se rechaza

(5°) CONCLUSIÓN: Con un nivel de significancia del 5%, con la evidencia muestral que se presenta, es altamente probable que exista diferencias entre las varianzas del segundo tramo etario

Page 17: Ejercicios resueltos Inferencia Estadistica

17

Hecha la prueba es posible realizar prueba para diferencia de medias (1°) LA HIPÓTESIS: Ho: 𝜇𝑥 − 𝜇𝑦 = 0

H1: 𝜇𝑥 − 𝜇𝑦 ≠ 0

(2°) LA REGION DE RECHAZO: Con 𝜶 = 0,05 RR: (−∞; −1,98 ] ∪ [ 1,98 ; ∞+) RNR: ] − 1,98 ; 1,98 [ (3°) T OBSERVADO:

𝑇𝑂𝐵𝑆 =�̅� − �̅� − 𝑘

√𝑆𝑋

2

𝑛𝑋+

𝑆𝑌2

𝑛𝑌

= 0,28

(4°) DECISIÓN:

𝒀𝒂 𝑞𝑢𝑒 0,28 ∈ 𝑹𝑵𝑹 Ho no se rechaza

(5°) CONCLUSIÓN: Con un nivel de significancia del 5%, con la evidencia muestral que se presenta, es altamente probable que el promedio del sueldo de los varones y de las mujeres en el grupo de edad Entre 30 y 40 años de la empresa no presente diferencias

Page 18: Ejercicios resueltos Inferencia Estadistica

18

Más de 40 años

830,5063611

55,45906017

198

822,1067135

26,34467242

132

Primero hay que comprobar a través de una prueba igualdad de varianzas: (1°) LA HIPÓTESIS:

Ho: 𝜎𝑥

2

𝜎𝑦2 = 1

H1: 𝜎𝑥

2

𝜎𝑦2 ≠ 1

(2°) LA REGION DE RECHAZO: Con 𝜶 = 0,05 RR: (−∞; 0,73 ] ∪ [ 1,38 ; ∞+) RNR: ] 0,73 ; 1,38 [ (3°) F OBSERVADO:

𝐹𝑂𝐵𝑆 =𝑆𝑥

2

𝑆𝑦2

×1

𝑘= 4,43

(4°) DECISIÓN:

𝒀𝒂 𝑞𝑢𝑒 4,43 ∈ 𝑹𝑹: Ho se rechaza

(5°) CONCLUSIÓN: Con un nivel de significancia del 5%, con la evidencia muestral que se presenta, es altamente probable que existan diferencias entre las varianzas del grupo Más de 40 años

Page 19: Ejercicios resueltos Inferencia Estadistica

19

Hecha la prueba es posible realizar prueba para diferencia de medias (1°) LA HIPÓTESIS: Ho: 𝜇𝑥 − 𝜇𝑦 = 0

H1: 𝜇𝑥 − 𝜇𝑦 ≠ 0

(2°) LA REGION DE RECHAZO: Con 𝜶 = 0,05 RR: (−∞; −1,97 ] ∪ [ 1,97 ; ∞+) RNR: ] − 1,97 ; 1,97 [ (3°) T OBSERVADO:

𝑇𝑂𝐵𝑆 =�̅� − �̅� − 𝑘

√𝑆𝑋

2

𝑛𝑋+

𝑆𝑌2

𝑛𝑌

= 1,84

(4°) DECISIÓN:

𝒀𝒂 𝑞𝑢𝑒 1,84 ∈ 𝑹𝑵𝑹 Ho no se rechaza

(5°) CONCLUSIÓN: Con un nivel de significancia del 5%, con la evidencia muestral que se presenta, es altamente probable que el promedio del sueldo de los varones y de las mujeres en el grupo de edad Más de 40 años de la empresa no presente diferencias

Page 20: Ejercicios resueltos Inferencia Estadistica

20

II. ARCHIVO 2 1. a) PARA LA CONDICIÓN 1: DESPEJADO

Analice si es posible utilizar un modelo de regresión lineal que permite estimar la cantidad de energía generada a partir de la velocidad del viento para cada condición climática.

LA HIPÓTESIS

Ho: No existe o no es posible establecer correlación lineal entre la velocidad del viento y la cantidad de energía generada cuando la condición climática es despejado H1: Existe o es posible establecer correlación lineal entre la velocidad del viento y la cantidad de energía generada cuando la condición climática es despejado. Para la condición despejado Excel arrojó la siguiente partida:

Por lo que planteando el estadístico 𝑇𝑜𝑏𝑠, se obtiene el valor

𝑇𝑜𝑏𝑠 = |𝜋 × √𝑛 − 2

√1 − 𝜋2| = 5,055965719

𝑇

(𝑛−2;1−𝛼2)

= 2,364624252

𝐶𝑜𝑚𝑜; 𝑇𝑜𝑏𝑠 > 𝑇

(𝑛−2;1−𝛼2)

; 𝐻𝑜 𝑑𝑒𝑏𝑒 𝑠𝑒𝑟 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑑𝑎

Valor P:

𝐸𝑙 𝑣𝑎𝑙𝑜𝑟 𝑝 𝑝𝑎𝑟𝑎 𝑇𝑜𝑏𝑠 𝑒𝑠 0,000734986

0,000734986 < 𝛼∗

𝐻𝑜 𝑑𝑒𝑏𝑒 𝑠𝑒𝑟 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑑𝑎 CONCLUSIÓN: Dada la evidencia muestral, es posible establecer con condición climática despejado

una correlación lineal entre la velocidad del viento y la cantidad de energía generada.

Estadísticas de la regresión

Coeficiente de correlación múltiple 0,886019583

Coeficiente de determinación R^2 0,785030701

R^2 ajustado 0,754320801

Error típico 5,984835239

Observaciones 9

Coeficientes Error típico Estadístico t

Intercepción -0,651877246 20,86241957 -0,031246483

Velocidad (Km/h) 2,791630414 0,552145835 5,055965719

Page 21: Ejercicios resueltos Inferencia Estadistica

21

b) PARA LA CONDICIÓN 2: PARCIAL NUBLADO

LA HIPÓTESIS Ho: No existe o no es posible establecer correlación lineal entre la velocidad del viento y la cantidad de energía generada cuando la condición climática es parcial nublado H1: Existe o es posible establecer correlación lineal entre la velocidad del viento y la cantidad de energía generada cuando la condición climática es parcial nublado.

Para la condición parcial nublado Excel arrojó la siguiente partida:

Coeficientes Error típico Estadístico t

Intercepción 22,35877642 9,369469867 2,38634381

Velocidad (Km/h) 2,254372945 0,183558619 12,28148783

Por lo que planteando el estadístico 𝑇𝑜𝑏𝑠, se obtiene el valor

𝑇𝑜𝑏𝑠 = |𝜋 × √𝑛 − 2

√1 − 𝜋2| = 12,28148783

𝑇(𝑛−2;1−

𝛼2)

= 2,032244509

𝐶𝑜𝑚𝑜; 𝑇𝑜𝑏𝑠 > 𝑇

(𝑛−2;1−𝛼2)

; 𝐻𝑜 𝑑𝑒𝑏𝑒 𝑠𝑒𝑟 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑑𝑎

Valor P:

𝐸𝑙 𝑣𝑎𝑙𝑜𝑟 𝑝 𝑝𝑎𝑟𝑎 𝑇𝑜𝑏𝑠 𝑒𝑠 0,0000000000000236

0,0000000000000236 < 𝛼∗

𝐻𝑜 𝑑𝑒𝑏𝑒 𝑠𝑒𝑟 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑑𝑎

CONCLUSIÓN: Dada la evidencia muestral, es posible establecer con condición parcial nublado una correlación lineal entre la velocidad del viento y la cantidad de energía generada.

Estadísticas de la regresión

Coeficiente de correlación múltiple 0,90335602

Coeficiente de determinación R^2 0,816052098

R^2 ajustado 0,810641866

Error típico 4,563739431

Observaciones 36

Page 22: Ejercicios resueltos Inferencia Estadistica

22

c) PARA LA CONDICIÓN 3: NUBLADO LA HIPÓTESIS

Ho: No existe o no es posible establecer correlación lineal entre la velocidad del viento y la cantidad de energía generada cuando la condición climática es nublado H1: Existe o es posible establecer correlación lineal entre la velocidad del viento y la cantidad de energía generada cuando la condición climática es nublado. Para la condición parcial nublado Excel arrojó la siguiente partida:

Coeficientes Error típico Estadístico t

Intercepción 21,5342806 13,33560171 1,614796323 Velocidad (Km/h) 2,314077377 0,211087881 10,96262544

Por lo que planteando el estadístico 𝑇𝑜𝑏𝑠, se obtiene el valor

𝑇𝑜𝑏𝑠 = |𝜋 × √𝑛 − 2

√1 − 𝜋2| = 10,96262544

𝑇(𝑛−2;1−

𝛼2)

= 2,160368656

𝐶𝑜𝑚𝑜; 𝑇𝑜𝑏𝑠 > 𝑇

(𝑛−2;1−𝛼2)

; 𝐻𝑜 𝑑𝑒𝑏𝑒 𝑠𝑒𝑟 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑑𝑎

Valor P:

𝐸𝑙 𝑣𝑎𝑙𝑜𝑟 𝑝 𝑝𝑎𝑟𝑎 𝑇𝑜𝑏𝑠 𝑒𝑠 0,000000030663

0,0000000000000236 < 𝛼∗

𝐻𝑜 𝑑𝑒𝑏𝑒 𝑠𝑒𝑟 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑑𝑎

CONCLUSIÓN: Dada la evidencia muestral, es posible establecer con condición nublado una correlación lineal entre la velocidad del viento y la cantidad de energía generada.

Estadísticas de la regresión

Coeficiente de correlación múltiple 0,949940592

Coeficiente de determinación R^2 0,902387128

R^2 ajustado 0,894878445

Error típico 3,122930882

Observaciones 15

Page 23: Ejercicios resueltos Inferencia Estadistica

23

a) PARA LA CONDICIÓN 1: DESPEJADO Es posible trazar el intervalo:

Límite inferior 1,486012982 Límite superior 4,097247846

Conclusión: Dada la evidencia muestral al 5% de significancia, es altamente probable que la contribución marginal de la velocidad del viento en la generación de energía sea del orden de 3 KW/(Km/h).

b) PARA LA CONDICIÓN 2: PARCIAL NUBLADO Es posible trazar el intervalo:

Límite inferior 1,881336949 Límite superior 2,627408941

Conclusión: Dada la evidencia muestral al 5% de significancia, es altamente probable que la contribución marginal de la velocidad del viento en la generación de energía no sea del orden de 3 KW/(Km/h).

c) PARA LA CONDICIÓN 3: NUBLADO Es posible trazar el intervalo:

Límite inferior 1,858049735 Límite superior 2,770105019

Conclusión: Dada la evidencia muestral al 5% de significancia, es altamente probable que la

contribución marginal de la velocidad del viento en la generación de energía no sea del orden de 3 KW/(Km/h).

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior

95%

Intercepción -

0,651877246 20,86241957 -0,031246483 0,975945215 -

49,98366052 48,67990602

Velocidad (Km/h) 2,791630414 0,552145835 5,055965719 0,001469971 1,486012982 4,097247846

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior

95%

Intercepción 22,35877642 9,369469867 2,38634381 0,022727191 3,317722732 41,39983012 Velocidad (Km/h) 2,254372945 0,183558619 12,28148783 4,72368E-14 1,881336949 2,627408941

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior

95%

Intercepción 21,5342806 13,33560171 1,614796323 0,130353465 -

7,275535343 50,34409654 Velocidad (Km/h) 2,314077377 0,211087881 10,96262544 6,13253E-08 1,858049735 2,770105019

Page 24: Ejercicios resueltos Inferencia Estadistica

24

ANEXO DATOS

Archivo 1:

Salarios del

mes

Homb

res

Muje

res

Homb

res

Muje

res

Homb

res

Muje

res

Homb

res

Muje

res

Homb

res

Homb

res

Entre 25 y

30 años

661,4

70

782,2

56

763,6

88

796,0

03

808,5

85

824,9

35

836,4

35

849,9

87

864,5

86

889,1

72

692,7

08

782,4

31

764,6

12

796,2

76

808,8

73

825,3

20

836,6

65

850,0

11

864,8

84

889,1

75

703,5

56

782,4

98

765,1

17

796,4

65

809,0

14

825,4

18

836,7

83

850,1

86

865,0

66

889,4

27

705,5

21

782,9

42

765,5

77

796,6

31

809,0

78

825,4

19

836,8

00

850,6

27

865,1

61

889,5

11

712,0

83

783,3

24

766,2

31

796,7

05

809,2

93

825,4

82

837,2

32

850,7

97

865,1

63

889,5

87

713,3

43

783,5

88

766,5

26

797,3

31

809,5

68

826,0

86

837,2

50

851,0

11

866,0

14

889,8

36

Entre30 y

40 años

717,9

67

783,9

41

766,9

34

797,5

28

809,7

51

826,5

55

837,4

53

851,1

29

866,4

08

890,2

45

721,7

84

784,0

73

768,4

44

798,1

22

809,7

85

826,6

56

837,7

97

851,8

62

866,6

65

890,4

23

728,2

24

784,0

75

769,1

56

798,4

44

809,8

83

826,7

65

837,8

78

853,5

69

867,3

43

890,9

31

730,1

60

784,4

40

769,3

54

798,6

62

810,5

65

826,9

35

838,1

06

853,6

58

867,5

09

891,0

03

732,1

04

784,6

50

769,7

83

798,7

12

811,1

71

827,1

54

838,1

37

853,8

54

868,2

08

891,3

45

732,2

73

785,2

68

770,1

40

798,7

40

811,2

27

827,3

21

838,2

11

854,1

80

868,4

93

892,0

77

733,8

26

785,2

98

770,9

57

799,1

54

811,6

96

827,6

37

838,3

29

854,4

43

868,9

59

892,5

55

Page 25: Ejercicios resueltos Inferencia Estadistica

25

735,1

65

785,3

27

771,2

75

800,1

44

811,9

09

827,9

68

839,4

06

854,7

17

869,0

00

893,2

73

735,2

10

785,4

34

771,8

02

800,4

15

812,3

28

828,1

88

839,5

53

854,8

81

869,7

57

893,3

37

736,0

97

785,7

05

772,2

17

800,6

09

812,4

22

828,5

93

839,5

69

855,2

67

870,2

93

893,8

35

736,8

09

785,7

95

772,2

19

800,6

61

812,8

56

828,5

96

839,7

31

855,2

75

870,3

27

894,0

94

Más de 40

años

739,3

47

786,1

96

772,6

31

800,9

63

812,8

91

828,7

04

839,8

68

855,4

65

870,3

69

894,4

11

739,7

90

786,3

35

772,6

39

801,3

34

813,0

39

828,7

86

840,1

71

855,5

24

870,5

71

894,8

53

740,1

79

787,7

00

772,6

54

801,6

57

813,2

17

829,0

44

841,0

08

855,6

24

870,5

90

895,6

25

741,6

11

787,8

01

772,7

71

801,9

10

813,2

24

829,0

52

841,4

07

855,8

45

871,6

58

895,6

92

742,3

46

788,2

48

772,9

43

802,2

77

813,6

33

829,1

08

842,0

44

857,3

05

872,0

04

895,7

58

745,1

18

788,6

01

773,1

39

802,7

03

813,6

51

829,3

88

842,3

73

857,3

14

872,2

29

896,4

63

747,3

91

788,7

31

774,4

36

803,3

86

813,7

44

829,6

15

842,5

65

857,3

28

872,3

52

896,5

14

748,1

11

789,0

82

774,6

49

803,4

32

813,9

67

830,0

63

842,7

78

857,3

82

872,6

99

896,5

66

748,2

92

789,3

51

774,7

74

803,4

39

814,2

53

830,3

28

842,8

40

857,4

42

872,8

72

898,3

22

749,2

80

789,6

63

775,7

42

803,7

60

815,0

35

830,4

00

842,9

36

857,6

49

873,5

27

899,4

79

749,3

17

790,0

85

775,9

49

803,8

96

815,1

11

830,5

12

843,1

61

858,1

26

874,5

24

900,0

25

Page 26: Ejercicios resueltos Inferencia Estadistica

26

749,5

27

790,0

95

776,1

10

804,2

63

815,9

80

830,6

02

843,2

79

858,6

98

876,2

59

901,9

29

751,8

66

790,1

35

776,2

29

804,3

41

816,1

24

830,6

57

843,3

46

858,7

75

876,2

99

901,9

56

752,0

49

790,1

84

776,4

28

804,6

43

816,1

46

830,7

39

843,4

76

858,8

30

876,6

16

902,3

19

753,2

16

790,4

06

776,4

97

804,6

96

816,8

62

831,6

87

843,6

17

858,8

99

876,7

43

904,7

53

753,4

00

790,9

83

778,0

46

804,8

09

817,5

05

831,7

91

843,7

51

859,0

14

878,7

08

906,7

01

753,4

01

791,5

25

778,1

76

805,0

72

817,8

79

832,6

38

844,2

16

859,4

01

879,5

82

908,6

01

754,4

13

792,4

41

778,2

77

805,1

94

818,0

51

832,7

22

845,3

44

859,4

63

879,6

60

909,6

67

755,4

08

792,4

67

778,6

90

805,2

80

818,4

01

833,1

46

846,0

31

859,4

71

880,4

51

910,6

05

755,4

65

793,2

33

778,7

69

805,7

40

818,6

22

833,2

83

846,2

39

860,0

68

880,7

35

911,3

06

755,6

41

793,2

91

778,7

82

805,8

85

819,0

31

833,2

95

846,4

77

860,1

19

881,2

16

911,8

82

755,8

76

793,2

91

779,2

11

806,0

18

819,4

27

833,4

79

846,6

34

860,1

83

883,3

53

912,8

77

757,2

97

793,3

33

779,3

68

806,6

06

819,6

31

833,8

42

846,7

40

860,8

05

883,6

14

913,4

82

758,8

01

793,5

93

780,0

03

806,6

68

819,9

39

834,6

73

846,7

86

860,9

43

883,7

38

913,8

06

758,9

76

793,6

25

780,0

30

806,7

84

820,2

24

834,9

56

847,2

76

861,4

02

883,8

56

915,3

89

759,1

08

793,6

32

780,0

87

807,1

61

820,2

92

835,3

42

847,3

87

861,5

07

884,5

35

918,3

99

Page 27: Ejercicios resueltos Inferencia Estadistica

27

759,3

11

793,7

62

780,3

24

807,2

23

820,8

04

835,3

44

847,5

45

862,0

31

886,7

89

924,0

31

760,7

75

794,5

51

780,4

17

807,3

61

821,5

89

835,7

34

847,6

83

862,0

89

886,8

55

926,1

72

762,0

53

794,6

35

780,9

22

807,8

11

822,1

70

835,7

77

848,2

86

862,2

48

886,9

49

933,6

20

762,6

95

795,3

17

781,1

79

807,8

56

822,7

25

835,8

29

848,5

32

862,4

42

887,1

93

934,7

53

763,0

62

795,3

65

781,3

14

808,1

25

823,3

07

836,1

62

848,6

13

863,4

09

887,5

33

934,9

51

763,0

72

795,6

10

781,6

23

808,1

50

824,5

95

836,2

19

849,2

34

863,6

05

887,7

85

936,6

85

763,5

52

795,9

09

781,9

27

808,4

14

824,6

48

836,3

28

849,8

60

864,3

98

888,9

40

960,1

50

Page 28: Ejercicios resueltos Inferencia Estadistica

28

Archivo 2:

Velocidad (Km/h) Energía (KW) Condición (*)

30,9 88,8 1

54,7 147,5 2

49,4 135 2

52,2 132,3 2

45,4 124,8 2

62,2 167,3 3

54,1 139 2

59,5 154,4 3

52,3 142,4 2

44,7 120,1 2

55,6 142,6 2

55,5 154,5 2

45,3 126,7 2

51,4 140 2

56,3 144,7 2

36,4 90,2 1

51,7 142,5 2

33,3 96 1

53,9 147,9 2

52,3 137,7 2

50,2 134,2 2

62,8 163,3 3

48,5 138,6 2

57,1 149,5 2

63,3 172,4 3

60,6 157,9 3

57,3 155,1 2

57,1 152,8 2

63,4 171,2 3

50,4 130,3 2

52,8 137,2 2

46,7 117,8 2

35,6 93,3 1

63,1 169,8 3

51,5 136,8 2

38,6 111,7 1

44,9 127 2

74,9 193,2 3

Page 29: Ejercicios resueltos Inferencia Estadistica

29

45 122,5 2

64,4 167,8 3

49,8 145,4 2

45,3 127,6 2

55,6 147,7 2

54,7 143,7 2

59,1 162,9 3

42,3 116,3 1

41 118,1 1

61,8 163,3 3

44,7 123,3 2

42,3 114,3 2

66,8 177,7 3

49,3 140,6 2

51 139,5 2

60,4 160,1 3

52,3 142,2 2

59 158 3

50,2 130 2

39,7 115,4 1

40,7 109,3 1

64,6 172,6 3

(*): Se refiere a la condición climática (1: Despejado; 2: Parcial Nublado; 3: Nublado)

Obs:

1.- Si la velocidad del viento es inferior a 50 Km/h se clasifica en normal 2.- Si la velocidad del viento es superior o mayor a 50 Km/h se clasifica como exce-sivo

3.- Si la producción de energía es inferior a 120 kw se clasifica como baja

4.- Si la producción de energía está entre 120 kw y 160 kw se clasifica como normal

5.- Si la producción de energía es superior a 160 kw se clasifica como máxima