Estadistica inferencial 2 Relaciones covarianzas y varianzas
-
Upload
genesis-acosta -
Category
Documents
-
view
4.076 -
download
7
Transcript of Estadistica inferencial 2 Relaciones covarianzas y varianzas
IGE
ESTADISTICA INFERENCIAL II - GÉNESIS GARCÍA ACOSTA - GUSTAVO REYES SANCHEZ
[ESTADISTICA INFERENCIAL II] INGENIERÍA EN GESTIÓN EMPRESARIAL
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 1
EJERCICIO 1 : (RESISTENCIA DEL BRAZO Y LEVANTAMIENTO DINÁMICO)
EL ESTUDIO “Development of LIFTEST, A Dynamic Technique to Assess
Individual Capability to Lift Material” se llevo a cabo, en 1982 en la Virginia
Polytechnic Institute and State University, con objeto de determinar si
ciertas mediciones de la resistencia estética del brazo tenían alguna
influencia en las características de la “elevación dinámica” de un
individuo. Veinticinco individuosse sometieron a pruebas de resistencia y
después se les pidió que llevaran acabo una prueba de levantamiento de
pesas en la cual debía levantar el peso en forma dinámica por encima de
la cabeza. Los datos fueron los siguientes:
Individuo Resistencia del brazo, x Levantamiento dinámico, y
1 17.3 71.7
2 19.3 48.3
3 19.5 88.3
4 19.7 75
5 22.9 91.7
6 23.1 100
7 26.4 73.3
8 26.8 65
9 27.6 75
10 28.1 88.3
11 28.2 68.3
12 28.7 96.7
13 29 76.7
14 29.6 78.3
15 29.9 60
16 29.9 71.7
17 30.6 85
18 31.3 85
19 36 88.3
20 39.5 100
21 40.4 100
22 44.3 100
23 44.6 91.7
24 50.4 100
25 55.9 71.7
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 2
A) Diagrama de Dispersión.
B) Determinar cada uno de los coeficientes de la línea y la ecuación de
la línea de regresión.
La ecuación de regresión es
Levantamiento dinámico,
y = 64.5 + 0.561
Resistencia del brazo, x
Predictor Coef SE Coef T P
Constante INTERSECCIÓN (a)64.5078.963 7.20 0.000
Resistencia del brazo, x PENDIENTE (b)0.56140.2747 2.04 0.053
C) Determinar la correlación.
Correlaciones: Resistencia del brazo, x, Levantamiento dinámico, y
Correlación de Pearson de Resistencia del brazo, x y Levantamiento
dinámico,
y = 0.392
6050403020
100
90
80
70
60
50
Resistencia del brazo, x
Le
va
nta
ien
to d
iná
mic
o,
yRegresion Lineal
resistencia del brazo- levantamento dinamico
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 3
Nos indica que es una correlación débilmente positiva, es decir, que
prácticamente no hay relación entre la resistencia del brazo y
levantamiento dinámico
D) Determinar coeficiente de determinación.
Resumen Estadísticas de la regresión
Coeficiente de correlación múltiple 0.39200086
Coeficiente de determinación R^2 0.15366467
R^2 ajustado 0.11686749
Error típico 13.2782625
Observaciones 25
E) Determinar la inferencia acerca de los coeficientes (prueba de
hipótesis).
Intersección
Pendiente
1. Datos
2.
3.
4.
5. Región critica
6. Cálculos
Predictor Coef SE Coef T P VIF
Constante 64.507 8.963 7.20 0.000
Resistencia del brazo, x 0.5614 0.2747 2.04 0.053 1.000
S = 13.2783R-cuad. = 15.4%
Como el valor del coeficiente de
determinación es de 0.15 ó 15.36% nos
indica que la variabilidad que se tiene
a la resistencia del brazo da la persona
esta explicada en un 15.36% de cada
lanzamiento dinámico del individuo.
Que indica que si se puede utilizar este
modelo para hacer análisis de
predicción.
H1
H0 H1
Región de aceptación
1- =0.95
Región critica o de
rechazo
Región critica o de
rechazo
Valor de de minitab
para la prueba de
hipótesis
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 4
7. Decisión
Como ó con un nivel de significancia de 0.05
se acepta la hipótesis nula y se concluye que es evidente que el valor de la
pendiente es igual a cero.
a) Intervalos de confianza para los parámetros de regresión
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%
Intercepción 64.507261 8.96256421 7.19741131 2.5034E-07 45.9667844 83.0477377
Variable X 1 0.56138443 0.27471392 2.04352382 0.05261908 -0.0069046 1.12967347
(-0.0069046, 1.12967347). Hay una confianza del 95% de que la
pendiente dela regresión poblacional de la resistencia del brazo influye en
la elevación dinámica de un individuo caiga entre -0.0069046 a 1.12967347
que tiene dicha influencia.
(45.9667844, 83.0477377).Hay una confianza el 95% de que la
intersección dela regresión poblacional de la resistencia del brazo influye
en la elevación dinámica de un individuo caiga entre 45.9667844 a
83.0477377.
Se aplica
Valores pronosticados para nuevas observaciones
EE de
Nueva obs Ajuste ajuste IC de 95% IP de 95%
1 81.352.67 (75.82, 86.88) (53.33, 109.37)
Valores de predictores para nuevas observaciones
Resistencia
Nueva obs del brazo, x
1 30.0
(75.82, 86.88).Con una confianza del 95% de que para la respuesta
media población para un valor diferente x0 se pueden obtener los
siguientes límites de confianza para está media 75.82 a 86.88 EE de
Nueva obs Ajuste ajuste IC de 95% IP de 95%
1 81.352.67 (75.82, 86.88)(53.33, 109.37)
(53.33, 109.37). Hay una confianza del 95% que un valor futuro de la
variable aleatoria caiga en 53.33 a 109.37
Para
Para
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 5
EE de
Nueva obs Ajuste ajuste IC de 95% IP de 95%
1 81.352.67 (75.82, 86.88) (53.33, 109.37)
Hay una confianza del 95% de que el valor medio de la resistencia
del brazo del individuo sea de 30, caiga entre(75.82, 86.88).
Hay una confianza del 95% de que el valor de la resistencia del brazo
del individuo sea de 30,caiga entre (53.33, 109.37).
F) Análisis de varianza de la línea de regresión del modelo establecido
del problema de la resistencia del brazo teniendo influencia en las
características del levantamiento dinámico de un individuo.
1. Datos
2.
3.
4.
5. Región critica
6. Cálculos
ANÁLISIS DE VARIANZA
Grados de
libertad Suma de
cuadrados Promedio de los
cuadrados F Valor crítico de
F
Regresión 1 736.278142 736.278142
4.1759896 0.05261908
Residuos 23 4055.18186 176.312255 Total 24 4791.46
Análisis de varianza
Fuente GL SC CM F P
Regresión 1 736.3 736.3 4.18 0.053
Error residual 23 4055.2 176.3
Falta de ajuste 22 3986.7 181.2 2.65 0.455
Error puro 1 68.4 68.4
Total 24 4791.5
H1 H0
Región critica o de
rechazo
Región de aceptación
1- =0.95
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 6
7. Decisión
Como de Excel ó de minitab, con un
nivel de significancia de 0.05 se rechaza la hipótesis nula y se concluye que
la influencia de la resistencia del brazo con respecto a las características
del levantamiento dinámico depende de la resistencia del brazo.
G) Análisis de residuales
Análisis de los residuales
Observación Pronóstico para Y Residuos Residuos estándares
1 74.2192117 -2.51921173 -0.19380507
2 75.3419806 -27.0419806 -2.08036218
3 75.4542575 12.8457425 0.98823371
4 75.5665344 -0.56653438 -0.04358396
5 77.3629646 14.3370354 1.10296012
6 77.4752415 22.5247585 1.73284851
7 79.3278101 -6.02781009 -0.46372447
8 79.5523639 -14.5523639 -1.11952552
9 80.0014714 -5.00147141 -0.38476738
10 80.2821636 8.01783637 0.61681886
11 80.3383021 -12.0383021 -0.92611665
12 80.6189943 16.0810057 1.23712522
13 80.7874096 -4.08740962 -0.31444784
14 81.1242403 -2.82424028 -0.21727117
15 81.2926556 -21.2926556 -1.6380618
16 81.2926556 -9.59265561 -0.73797102
17 81.6856247 3.31437528 0.25497766
18 82.0785938 2.92140618 0.22474622
19 84.7171007 3.58289933 0.27563544
20 86.6819462 13.3180538 1.02456902
21 87.1871922 12.8128078 0.98570002
22 89.3765915 10.6234085 0.8172677
23 89.5450068 2.15499319 0.16578543
24 92.8010365 7.19896347 0.55382228
25 95.8886509 -24.1886509 -1.86085314
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 7
A) Gráfica de Normalidad
Existe una normalidad de los
errores porque están muy cerca
de la línea recta.
B) Histograma de Residuales
Podemos observar que los errores
o residuos no son normales. El
histograma presenta varios picos.
C) Residuales Valores predichos
Se detecta que hay dos datos
anormales porque están bastante
lejos de la media.
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 8
D) Residuales Índice de la observación
Se observa tres dato deresiduo
muy grande.
E) Residuales Variable predictora
6050403020
20
10
0
-10
-20
-30
Resistencia del brazo, x
Re
sid
uo
Residuos vs. Resistencia del brazo, x(la respuesta es Levantaiento dinámico, y)
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 9
23 filas sin réplica
Resistencia Levantamiento EE de Residuo
Obs del brazo, x dinámico, y Ajuste ajuste Residuo estándar
1 17.3 71.70 74.22 4.64 -2.52 -0.20
2 19.3 48.30 75.34 4.20 -27.04 -2.15 R existe un
punto anormal con respecto a la media de los residuo de la resistencia del brazo.
Resistencia de 19.3 con un residuo de -27.04 estandarizado es de -2.15
3 19.5 88.30 75.45 4.16 12.85 1.02
4 19.7 75.00 75.57 4.12 -0.57 -0.04
5 22.9 91.70 77.36 3.49 14.34 1.12
6 23.1 100.00 77.48 3.46 22.52 1.76
7 26.4 73.30 79.33 2.96 -6.03 -0.47
8 26.8 65.00 79.55 2.91 -14.55 -1.12
9 27.6 75.00 80.00 2.83 -5.00 -0.39
10 28.1 88.30 80.28 2.79 8.02 0.62
11 28.2 68.30 80.34 2.78 -12.04 -0.93
12 28.7 96.70 80.62 2.74 16.08 1.24
13 29.0 76.70 80.79 2.72 -4.09 -0.31
14 29.6 78.30 81.12 2.69 -2.82 -0.22
15 29.9 60.00 81.29 2.68 -21.29 -1.64
16 29.9 71.70 81.29 2.68 -9.59 -0.74
17 30.6 85.00 81.69 2.66 3.31 0.25
18 31.3 85.00 82.08 2.66 2.92 0.22
19 36.0 88.30 84.72 2.97 3.58 0.28
20 39.5 100.00 86.68 3.51 13.32 1.04
21 40.4 100.00 87.19 3.67 12.81 1.00
22 44.3 100.00 89.38 4.48 10.62 0.85
23 44.6 91.70 89.55 4.55 2.15 0.17
24 50.4 100.00 92.80 5.92 7.20 0.61
25 55.9 71.70 95.89 7.30 -24.19 -2.18 RX hay una
graninfluencia
R denota una observación con un residuo estandarizado grande.
X denota una observación cuyo valor X le concede gran apalancamiento.
Se detectaron 2 puntos anormales debido a que el valor 2 de la resistencia
del brazo es de 19.3 presenta un residuo de -27.04, lo cual es muy grande
además esta el otro valor número 25 con resistencia del brazo 55.9 el
residuo es de -24.19 en el cual indica que hay una gran influencia debido a
que se presenta un cambio muy significativo.
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 10
EJERCICIO 6,381 (EXAMEN DE UBICACIÓN Y CALIFICACIÓN DE CURSO)
Se aplica una prueba de ubicación de matemáticas a todos los alumnos
de primer grado que están ingresando a una institución de enseñanza
superior. No se admiten a los que obtienen una calificación inferior a 35 en
el curso regular de matemáticas y se les coloca en una clase de
regularización. Las calificaciones del examen de ubicación y den examen
final de 20 estudiantes que tomaron el curso regular fueron las siguientes:
Examen de ubicación (x) Calificación de curso (y)
50 53
35 41
35 61
40 56
55 68
65 36
35 11
60 70
90 79
35 59
90 54
80 91
60 48
60 71
60 71
40 47
55 53
50 68
65 57
50 79
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 11
A) Gráfica de dispersión
90807060504030
90
80
70
60
50
40
30
20
10
0
exámen de ubicación
ca
lific
ació
n d
el cu
rso
ejercicio de regresión lineal simple y correlaciónexamen de ubicación-calificación del curso
Uno de los de los datos se encuentra mayormente disperso de la
línea de regresión.
B) Determinación del coeficiente de la línea y de la ecuación de la
línea de regresión lineal simple.
Ecuación de regresión:
La ecuación de regresión lineal simple es
Calificación del curso y = 32.5 + 0.471 examen de ubicación
Donde:
El valor de la intercepción (a) = 32.5
El valor de la pendiente (b) = 0.471
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 12
Predictor coeficiente Coeficiente de EE T P VIF
Constante 32.5 12.64 2.57 0.019
Examen de ubicación 0.4711 0.2182 2.16 0.045 1.000
Interpretación de la intercepción (a): El valor promedio de las
calificaciones del curso cuando la variable de predicción (examen de
ubicación) es cero es de 32.5
Intercepción de la pendiente (b): El cambio promedio en las calificaciones
del curso ocurrirá con el incremento de la variable predictora (examen de
ubicación) en un 0.0471
C) Correlación de Pearson de examen de ubicación y calificación del
curso
Los datos que arroja el minitab, respecto a este inciso y = 0.454 por lo
tanto se concluye que:
Como el valor de la correlación es de 0.454, indica que es débilmente
positiva y por lo tanto la calificación del examen de ubicación del alumno
no significara que este dentro del curso regular.
D) Determinación del coeficiente de determinación
S = 16.1747 R-cuad. = 20.6% R-cuad.(ajustado) = 16.2%
Como el valor del coeficiente de determinación es de 20.6% nos indica
que la variabilidad que se tiene de la calificación del alumno esta
explicada en un 20.6% por su relación lineal que tiene con el examen de
ubicación, por lo tanto no hay una buena asociación para hacer el análisis
de predicción.
.
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 13
E) Inferencia acerca de los coeficientes, prueba de hipótesis
intersección
1. Datos
2. H0: β=0
3. H1:β≠0
4. α=0.0.5
5. region critica
6. cálculos
Predictor Coef SE Coef T P VIF
Constante 32.51 12.64 2.57 0.019
examen de ubicación, x 0.4711 0.2182 2.16 0.045 1.000
Del programa de Minitab tomaremos el dato del valor de P
para realizar el análisis de la hipótesis nula.
Valor P = 0.045
α= 0.05
Como el valor de P (0.045) es menor que el nivel de significancia (α=
0.05) la hipótesis nula se rechaza. Por lo tanto el valor de la pendiente es
diferente a cero.
Valor de de minitab
para la prueba de
hipótesis
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 14
Como tR= 2.16 y este es mayor a ttabla=2.101 con un nivel de
significancia de 0.05 se rechaza la H0 y se concluye que la evidencia
demuestra que la pendiente es diferente de cero.
F) Intervalos de confianza para los parámetros de regresión
INTERVALO DE CONFIANZA PARA Β (dato tomado de los cálculos hechos
en Excel)
Hay una confianza de 95% de que la pendiente de la regresión
poblacional de la calificación del curso respecto al examen de ubicación
caiga entre:
(0.0126448, 0.92948441)
INTERVALO PARA (dato tomado de los cálculos hechos en Excel)
Aceptación
Rechazo Rechazo
tR =2.16 tR =2.16
Ttabla =-2.101 Ttabla =2.101
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 15
Hay una confianza de 95% de que la intercepción de la regresión
poblacional de la calificación del curso respecto al examen de ubicación
caiga entre:
(5.95315676, 59.0586722)
INTERVALO PARA EL VALOR MEDIO DE (dato tomado de minitab)
v=n-2
Hay una confianza de 95% de que para la respuesta media poblacional
para un valor diferente (X0) se pueden obtener los siguientes limites de
confianza para esta media: (53.8428 , 70.5232)
INTERVALO DE PREDICCIÓN PARA YO (dato tomado de minitab)
v=n-2
Hay una confianza del 95% de que un valor futuro de la variable aleatoria
caiga en este rango: (27.1926, 97.1734)
Conclusión:
Hay un 95% de confianza de que el valor medio de todas la
calificaciones de 63 caigan entre (53.8428, 70.5232)
Hay un 95% de confianza de que la calificación de un alumno sea
de 63 caiga entre (27.1926, 97.1734)
G) Análisis de varianza
1. datos anteriores
2. Ho:β=0
3. H1:β≠0
4. α =0.05
5. Regresión critica
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 16
6. Cálculos.
Fuente GL SC MC F P
Regresión 1 1219.4 1219.4 4.66 0.045
Error residual 18 4709.2 261.6
Falta de ajuste 6 1688.5 281.4 1.12 0.408
Error puro 12 3020.7 251.7
Total 19 5928.5
F0.05 (1,18) = 4.41
Como 4.66 (FR) › 4.41 (F0.05 (1,18) con un nivel de significancia de 0.05 se
rechaza la H0 y se concluye que las calificaciones del alumno podrían
depender del examen de ubicación del alumno.
H) Análisis residual
exámen de calificación Ajuste Residuo
Obs ubicación del curso Ajuste SE Residuo estándar
1 50.0 53.00 56.06 3.81 -3.06 -0.19
2 35.0 41.00 48.99 5.75 -7.99 -0.53
3 35.0 61.00 48.99 5.75 12.01 0.79
4 40.0 56.00 51.35 4.95 4.65 0.30
5 55.0 68.00 58.41 3.62 9.59 0.61
6 65.0 36.00 63.13 4.17 -27.13 -1.74
7 35.0 11.00 48.99 5.75 -37.99 -2.51R
8 60.0 70.00 60.77 3.75 9.23 0.59
9 90.0 79.00 74.90 8.35 4.10 0.30
10 35.0 59.00 48.99 5.75 10.01 0.66
11 90.0 54.00 74.90 8.35 -20.90 -1.51
12 80.0 91.00 70.19 6.45 20.81 1.40
13 60.0 48.00 60.77 3.75 -12.77 -0.81
14 60.0 71.00 60.77 3.75 10.23 0.65
15 60.0 71.00 60.77 3.75 10.23 0.65
16 40.0 47.00 51.35 4.95 -4.35 -0.28
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 17
17 55.0 53.00 58.41 3.62 -5.41 -0.34
18 50.0 68.00 56.06 3.81 11.94 0.76
19 65.0 57.00 63.13 4.17 -6.13 -0.39
20 50.0 79.00 56.06 3.81 22.94 1.46
Se determina que existe un dato en los residuos que presenta anormalidad
ya que se encuentra alejado de la media del examen de ubicación.
I) Gráficas de residuos
1. Gráfica de normalidad
40200-20-40
99
90
50
10
1
Residuo
Po
rce
nta
je
706050
20
0
-20
-40
Valor ajustado
Re
sid
uo
20100-10-20-30-40
8
6
4
2
0
Residuo
Fre
cu
en
cia
2018161412108642
20
0
-20
-40
Orden de observación
Re
sid
uo
Gráfica de probabilidad normal vs. ajustes
Histograma vs. orden
Gráficas de residuos para calificación del curso
Se concluye que hay normalidad ya que los puntos se encuentran
cerca de la recta.
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 18
2. Histograma de residuales 40200-20-40
99
90
50
10
1
Residuo
Por
cent
aje
706050
20
0
-20
-40
Valor ajustado
Res
iduo
20100-10-20-30-40
8
6
4
2
0
Residuo
Frec
uenc
ia
2018161412108642
20
0
-20
-40
Orden de observación
Res
iduo
Gráfica de probabilidad normal vs. ajustes
Histograma vs. orden
Gráficas de residuos para calificación del curso
Como el pico no se encuentra en el centro se concluye que no hay
normalidad
3. Residuales vs valores predichos
40200-20-40
99
90
50
10
1
Residuo
Po
rce
nta
je
706050
20
0
-20
-40
Valor ajustado
Re
sid
uo
20100-10-20-30-40
8
6
4
2
0
Residuo
Fre
cue
nci
a
2018161412108642
20
0
-20
-40
Orden de observación
Re
sid
uo
Gráfica de probabilidad normal vs. ajustes
Histograma vs. orden
Gráficas de residuos para calificación del curso
Como en esta gráfica hay datos que se encuentran bastantes alejados
en el sentido vertical, por lo tanto hay datos anormales. Entonces la
varianza de los errores no es constante a la variable de respuesta.
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 19
4. Gráfica residuales vs el índice de la observación
40200-20-40
99
90
50
10
1
Residuo
Po
rce
nta
je
706050
20
0
-20
-40
Valor ajustado
Re
sid
uo
20100-10-20-30-40
8
6
4
2
0
Residuo
Fre
cu
en
cia
2018161412108642
20
0
-20
-40
Orden de observación
Re
sid
uo
Gráfica de probabilidad normal vs. ajustes
Histograma vs. orden
Gráficas de residuos para calificación del curso
Como hay datos residuales más haya de -2 o -20 es considerado un punto
fuera en el sentido vertical. Por lo tanto se considera un dato anormal.
5. Residuales vs variable predictora
90807060504030
30
20
10
0
-10
-20
-30
-40
exámen de ubicación
Re
sid
uo
Residuos vs. exámen de ubicación(la respuesta es calificación del curso)
Se determina que existen un punto que presentan anormalidad en
respecto al valor del promedio del examen de ubicación por lo tanto
podría decirse que la varianza de los errores no es constante con respecto
a la variable predictora.
Debido a que el valor del dato 7 presenta un residuo respecto a la media
es de -37.9932 el cual es muy grande respecto al valor de la media de los
residuos del examen de ubicación.
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 20
El departamento de personal de una empresa utilizo a dos individuos en un
estudio para determinar la relación entre su comportamiento hacia el
trabajo (y) y las calificaciones de 1 prueba. Los datos son los siguientes:
No y x y xy
1
2
3
4
5
6
7
8
9
10
11
12
11.2
14.5
17.2
17.8
19.3
24.5
21.2
16.9
14.8
20.0
13.2
22.5
56.5
59.5
69.2
74.5
81.2
88.0
78.2
69.0
58.1
80.5
58.3
84.0
3192.25
3540.25
4788.64
5550.25
6593.44
7744
6115.24
4761
3375.61
6480.25
3398.89
7056
125.44
210.25
295.84
316.84
372.49
600.25
449.44
285.61
219.04
400
174.24
506.25
632.8
862.75
1190.24
1326.1
1567.16
2156
1657.84
1166.1
859.88
1610
769.56
1890
213.1 857 62, 595.82 3, 955.69 15, 688.43
Prom. 17.75833333 71.4166667 5216.31833 329.640833 1, 307.36917
H) Diagrama de Dispersión.
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 21
I) Determinar cada uno de los coeficientes de la línea.
La ecuación de regresión es
y = - 6.17 + 0.335 x1
Predictor Coef Coef. de EE T P
Constante -6.167 2.186 -2.82 0.018“a” intersección
x1 0.33466 0.03027 11.06 0.000 “b” pendiente.
- Interpretación de la intersección (a): si tuviéramos unacalificación de
0 su comportamiento promedio sería de
Interpretación de la pendiente (b): El valor de b=.3373758445 indica
que por cada punto que aumenta la calificación, el aumento de
comportamiento hacia el trabajo será en unos .33373758445 puntos.
J) Determinar la correlación.
y = 0.961
- Interpretación: como la correlación tiene un valor de 0.961nos está
indicando una correlación medianamente positiva y nos indica que
cuando aumenta las calificaciones del trabajo se espera que
aumente el trabajo.
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 22
K) Determinar coeficiente de determinación.
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.34078049
Coeficiente de determinación R^2 0.11613134
R^2 ajustado 0.02774448
Error típico 3.55518239
Observaciones 12
Interpretación: como el valor del coeficiente de determinación es de .1161 nos
dice que la variabilidad que se tiene de las calificaciones, se explica en un 11.61%
del comportamiento de cada individuo.
Se indica que se puede utilizar dicho modelo para hacer el análisis de predicción.
L) Determinar la inferencia acerca de los coeficientes.
Prueba de Hipótesis
1. Datos
2. Ho:
3. H1:
4.
5. Región Crítica
6. Cálculos Predictor Coef Coef. de EE T P VIF
Constante -6.167 2.186 -2.82 0.018
x1 0.33466 0.03027 11.060.000 1.000
(valor de minitab tr)
S = 1.12928R-cuad. = 92.4%
H
ÁREA RECHAZADA H1
ÁREA RECHAZADA
H0 REGIÓN DE
ACEPTACIÓN.
T= -2.179 T= 2.179 T= 0
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 23
Valor P = 0.000
Como el valor de P=0.000 es menor que el nivel de
significancia de 0.05 la H0 se rechaza y por lo tanto el
valor de la pendiente es diferente de CERO
M) Intervalos de confianza para los parámetros de regresión.
- Intervalo de confianza para
Hay una confianza de 95% de que la pendiente de la regresión poblacional del
precio del auto respecto a los años de uso caiga entre:
(-0.29379964,0.9163594)
- Intervalo de confianza para
- Hay una confianza de 95% de que la intercepción de la regresión poblacional del precio del auto respecto a los años de uso caiga entre:
(-10.013644,11.9580201)
- Intervalo de confianza para
Hay una confianza de 95% de que para la respuesta media poblacional para un
valor diferente (X0) se pueden obtener los siguientes límites de confianza para
esta media
(16.5266,17.9918)
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 24
Intervalo de predicción para
Hay una confianza del 95% de que un valor futuro de la variable aleatoria caiga
en este rango:
(14.6385 19.8799)
Conclusión: Hay un 95% de confianza de que el valor medio de que las calificaciones de los individuos caigan entre
(16.5266,17.9918)
Hay un 95% de confianza de que el valor de que las calificaciones de los individuos caigan entre
(14.6385 19.8799)
G)
1. datos anteriores
2. Ho:β=0
3. H1:β≠0
4. α =0.05
5. Regresión critica
ACEPTACIÓN
CRÍTICA O RECHAZO
H1 H0
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 25
6 CÁLCULOS.
Fuente de
variación
Suma de
cuadrados
Cuadrados
medios
Grados de
libertad
F calculada
Regresión 16.6067818
158.4108917 1 1.313898173
Error 126.393218
1.2978275 10
total 143
11
Interpretación: Como 1.313898173<4.96con un nivel de significancia de 0.05
se acepta la hipótesis nula y concluimos que las fluctuaciones aleatorias
del precio del comportamiento hacia el trabajo depende de las
calificaciones de las pruebas.
h) Análisis residual
Observación Pronóstico
para Y Residuos Residuos estándares
1 4.45852276 -3.458522758 -1.02029344
2 5.48574638 -3.485746376 -1.028324638
3 6.32620206 -3.326202065 -0.981257718
4 6.51297 -2.512969995 -0.741347385
5 6.97988982 -1.979889822 -0.584084229
6 8.59854522 -2.598545221 -0.7665928
7 7.5713216 -0.571321602 -0.168544701
8 6.2328181 1.767181901 0.521333595
9 5.57913034 3.420869658 1.009185458
10 7.19778574 2.802214259 0.826676887
11 5.08108253 5.918917473 1.746130673
12 7.97598545 4.024014548 1.187118297
No hay algún dato en los residuos que presente anormalidad.
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 26
i) Gráficas
Gráfica de normalidad: no encontramos dentro de la gráfica datos que se
encuentren muy lejanos.
Gráfica de residuales: En ésta gráfica hay algunos picos más altos
Gráfica de residuales vs valores predictores Al visualizar la gráfica
observamos que algunos puntos si están algo alejados , por lo que hay
algunos datos anormales
Residuales Vs índice de observación
210-1-2
99
90
50
10
1
Residuo
Po
rce
nta
je
2220181614
2
1
0
-1
-2
Valor ajustado
Re
sid
uo
1.51.00.50.0-0.5-1.0-1.5
3
2
1
0
Residuo
Fre
cu
en
cia
121110987654321
2
1
0
-1
-2
Orden de observación
Re
sid
uo
Gráfica de probabilidad normal vs. ajustes
Histograma vs. orden
Gráficas de residuos para y
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 27
En un estudio acerca de la cantidad de precipitación pluvial y la cantidad
de contaminación de aire eliminada, se obtuvieron los siguientes datos:
No. Lluvia
diaria, x
(0.01 cm)
Partículas
elim, y mlg
por m3
1
2
3
4
5
6
7
8
9
4.3
4.5
5.9
5.6
6.1
5.2
3.8
2.1
7.5
126
121
116
118
114
118
132
141
108
18.49
20.25
34.81
31.36
37.21
27.04
14.44
4.41
56.25
15876
14641
13456
13924
12996
13924
17424
19881
11664
541.8
544.5
684.4
660.8
695.4
613.6
501.6
296.1
810
45 1094 244.26 133786 5348.2
Prom. 5 121.555556 27.14 14865.1111 594.244444
A) Diagrama de Dispersión.
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 28
B) Determinar cada uno de los coeficientes de la línea.
y = 153.2768249 + (-6.34425377)
- Interpretación de la intersección (a)
El valor de (a) indica que la cantidad promedio de precipitación
pluvial en relación con la cantidad de contaminación de aire
eliminada se encuentra en unos 153.175 miligramos por metros
cúbicos.
- Interpretación de la pendiente (b)
El valor de indica que por cada 0.01 cm de Lluvia diaria
adicional, las partículas eliminadas miligramos por metro cúbico
disminuirá en -6.340
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 29
C) Determinar la correlación.
- Interpretación: como la correlación tiene un valor de nos está
indicando una correlación fuertemente negativa y por lo tanto la
cantidad de lluvia diaria es negativamente relacionado con las
partículas eliminadas.
D) Determinar coeficiente de determinación.
- Interpretación: como el valor del coeficiente de determinación es
del 95.8%nos indica que la variabilidad que se tiene de las lluvias
diarias esta explicada en un 95.8% por su relación lineal que tiene
con las partículas eliminadas mlg por metro cúbico, por lo tanto
existe una buena asociación para hacer el análisis de predicción.
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 30
E) Determinar la inferencia acerca de los coeficientes.
Prueba de Hipótesis
1. Datos
2. Ho:
3. H1:
4.
5. Región Crítica
6. Cálculos
Predictor Coef SE Coef T P VIF
Constante 153.175 2.615 58.58 0.000
Lluvia diaria, x (0.01 cm) -6.3240 0.5019 -12.60 0.000 1.000
(valor de minitab tr)
7. Cálculos
H
ÁREA RECHAZADA H1
ÁREA RECHAZADA
H0 REGIÓN DE
ACEPTACIÓN.
T= -2.385 T= 2.385 T= 0
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 31
8. Conclusión
Como Tr = -12.60 y este es menorr a con un nivel de
significancia de 0.05 se rechazala hipótesis nula y se concluye que el
valor de la pendiente difiere de 0.
F) Intervalos de confianza para los parámetros de regresión.
INTERVALO DE CONFIANZA PARA Β (dato tomado de los cálculos hechos
en Excel)
Hay una confianza de 95% de que la pendiente de la regresión
poblacional de la calificación del curso respecto al examen de ubicación
caiga entre:
(0.0126448, 0.92948441)
INTERVALO PARA (dato tomado de los cálculos hechos en Excel)
Hay una confianza de 95% de que la intercepción de la regresión
poblacional de la calificación del curso respecto al examen de ubicación
caiga entre:
(5.95315676, 59.0586722)
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 32
INTERVALO PARA EL VALOR MEDIO DE (dato tomado de minitab)
v=n-2
Hay una confianza de 95% de que para la respuesta media poblacional
para un valor diferente (X0) se pueden obtener los siguientes limites de
confianza para esta media: (53.8428 , 70.5232)
INTERVALO DE PREDICCIÓN PARA YO (dato tomado de minitab)
v=n-2
Hay una confianza del 95% de que un valor futuro de la variable aleatoria
caiga en este rango: (27.1926, 97.1734)
Conclusión:
Hay un 95% de confianza de que el valor medio de todas la
calificaciones de 63 caigan entre (53.8428, 70.5232)
Hay un 95% de confianza de que la calificación de un alumno sea
de 63 caiga entre (27.1926, 97.1734)
I) Análisis de varianza
7. datos anteriores
8. Ho:β=0
9. H1:β≠0
10. α =0.05
11. Regresión critica
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 33
12. Cálculos.
Fuente GL SC MC F P
Regresión 1 1219.4 1219.4 4.66 0.045
Error residual 18 4709.2 261.6
Falta de ajuste 6 1688.5 281.4 1.12 0.408
Error puro 12 3020.7 251.7
Total 19 5928.5
F0.05 (1,18) = 4.41
Como 4.66 (FR) › 4.41 (F0.05 (1,18) con un nivel de significancia de 0.05 se
rechaza la H0 y se concluye que las calificaciones del alumno podrían
depender del examen de ubicación del alumno.
J) Análisis residual
Lluvia Partículas
diaria, x elim, y EE de Residuo
Obs (0.01 cm) mlg por m3 Ajuste ajuste Residuo estándar
1 4.30 126.000 125.982 0.814 0.018 0.01
2 4.50 121.000 124.718 0.776 -3.718 -1.80
3 5.90 116.000 115.864 0.862 0.136 0.07
4 5.60 118.000 117.761 0.794 0.239 0.12
5 6.10 114.000 114.599 0.919 -0.599 -0.30
6 5.20 118.000 120.291 0.741 -2.291 -1.10
7 3.80 132.000 129.144 0.950 2.856 1.44
8 2.10 141.000 139.895 1.630 1.105 0.75
9 7.50 108.000 105.746 1.454 2.254 1.36
IGE [ESTADISTICA INFERENCIAL II]
ESTADISTICA INFERENCIAL II |EQUIPO 4 34
G) Gráficas
5.02.50.0-2.5-5.0
99
90
50
10
1
Residuo
Po
rce
nta
je
140130120110
2
0
-2
-4
Valor ajustado
Re
sid
uo
3210-1-2-3-4
3
2
1
0
Residuo
Fre
cu
en
cia
987654321
2
0
-2
-4
Orden de observación
Re
sid
uo
Gráfica de probabilidad normal vs. ajustes
Histograma vs. orden
Gráficas de residuos para Partículas elim, y mlg por m3
Gráfica de normalidad: no encontramos dentro de la gráfica datos que se
encuentren muy lejanos.
Gráfica de residuales: En ésta gráfica solo en el intervalo de cero hay una
frecuencia un poco menor de 3
Gráfica de residuos vs ajustes:
Gráfica de residuos vs orden de observación: