Apuntes Clase Estadistica Ii(Itsz)

106
MII. ING. EDGAR JAVIER SILVA

Transcript of Apuntes Clase Estadistica Ii(Itsz)

Page 1: Apuntes Clase Estadistica Ii(Itsz)

MII. ING. EDGAR JAVIER SILVA

Page 2: Apuntes Clase Estadistica Ii(Itsz)

Examen escrito

65%

Practicas ,tareas, participación y evaluación continua

35%

Page 3: Apuntes Clase Estadistica Ii(Itsz)

Probabilidad y Estadística Douglas C. Montgomery Mc Graw Hill

Probabilidad y Estadística para Ingeniería y Ciencias Mendenhall Prentice Hall

Diseño de Experimentos, Douglas C. Montgomery

http://mathworld.wolfram.com/classroom/classes/ProbabilityandStatistics.html

Page 4: Apuntes Clase Estadistica Ii(Itsz)

Regresión lineal simple.

Prueba de hipótesis en la regresión lineal simple.

Calidad del ajuste en regresión lineal simple.

Estimación y predicción por intervalo en regresión lineal simple.

Regresión lineal múltiple.

Pruebas de hipótesis en regresión lineal múltiple.

Intervalos de confianza y predicción en regresión múltiple.

Page 5: Apuntes Clase Estadistica Ii(Itsz)

¿Existe alguna relación entre el grado de oscuridad nocturna, la temperatura ambiente y el apetito de los ratones?

¿Existe alguna relación entre el numero de homicidios y el grado de estudios alcanzados en los diferentes municipios?

Page 6: Apuntes Clase Estadistica Ii(Itsz)

Para investigar la correlación entre dosvariables, en estadística se han creado loscoeficientes de correlación que permitenexpresar cuantitativamente el grado derelación que existe entre las dos variables.

Page 7: Apuntes Clase Estadistica Ii(Itsz)

Operativos que se

implentan en el mes.

Numero de automóviles

robados

2 10

3 15

4 20

5 25

6 30

7 34

Page 8: Apuntes Clase Estadistica Ii(Itsz)

2; 10

3; 15

4; 20

5; 25

6; 30

7; 35

0

5

10

15

20

25

30

35

40

0 2 4 6 8

Operativos

au

tom

ovil

es r

ob

ad

os

Serie1

-1 0 +1Correlación Negativa Correlación Positiva

No hay

Page 9: Apuntes Clase Estadistica Ii(Itsz)

0

2

4

6

8

10

12

14

16

18

0 2 4 6 8

Serie1

r= +0.8

Page 10: Apuntes Clase Estadistica Ii(Itsz)

0

2

4

6

8

10

12

14

16

18

0 2 4 6 8

Serie1

r = -0.7

Page 11: Apuntes Clase Estadistica Ii(Itsz)

0

5

10

15

20

25

30

35

40

0 2 4 6 8

Serie1

r = 0

Page 12: Apuntes Clase Estadistica Ii(Itsz)

CORRELACIÓN VALOR O RANGO

Perfecta |R| = 1

Excelente 0.9 <= |R| < 1

Buena 0.8 <= |R| < 0.9

Regular 0.5 <= |R| <0.8

Mala |R|< 0.5

Page 13: Apuntes Clase Estadistica Ii(Itsz)

r = n(ΣXY) – (ΣX)(ΣY)

√ [n(ΣX2) – (ΣX)2][n(ΣY2) – (ΣY)2]

n es el número de pares de observaciones.

Σx es la suma de valores de la variable x

Σy es la suma de valores de la variable y

Page 14: Apuntes Clase Estadistica Ii(Itsz)

X Y X2 XY Y2

2 10

3 15

4 20

5 25

6 30

7 34

27

Page 15: Apuntes Clase Estadistica Ii(Itsz)

Numero de

anuncios por

hora

X

Ventas

semanales

Y

X2 XY Y2

4 5

7 12

3 4

6 8

10 11

30 40 210 274 370

Page 16: Apuntes Clase Estadistica Ii(Itsz)
Page 17: Apuntes Clase Estadistica Ii(Itsz)
Page 18: Apuntes Clase Estadistica Ii(Itsz)
Page 19: Apuntes Clase Estadistica Ii(Itsz)

Coeficiente de determinación: es la proporción dela variación total en la variable dependiente Y quese explica por, o se debe a, la variación en lavariable independiente X

r2 = coeficiente de determinación

Page 20: Apuntes Clase Estadistica Ii(Itsz)

Dibuja la siguiente ecuación.

Y =2X +3 x y

0

1

2

3

Damos valores X para

encontrar los correspondient

es de Y

Page 21: Apuntes Clase Estadistica Ii(Itsz)

Y = 3X + 5 x y

0

1

2

m =

b =

Page 22: Apuntes Clase Estadistica Ii(Itsz)

Numero de

anuncios por

hora

X

Ventas

semanales

Y

X2 XY Y2

4 5

7 12

3 4

6 8

10 11

30 40 210 274 370

Page 23: Apuntes Clase Estadistica Ii(Itsz)

¿Cuál es la diferencia entre un grafico de dispersión y la ecuación de regresión?

Page 24: Apuntes Clase Estadistica Ii(Itsz)

m = pendiente de la recta

b= ordenada al origen

22)()(

))(()(

XXn

YXXYnm

)/(/ nXmnYb

Page 25: Apuntes Clase Estadistica Ii(Itsz)

Se tiene interés en examinar latasa de matrimonios y dedivorcios por millar dehabitantes en Tijuana para añosseleccionados. Las tasas para 8años, según el encargado de losmunicipios son:

1. Trace un diagrama de dispersiónlocalizando la tasa dematrimonios en el eje x , y latasa de divorcios en el eje y.

2. Si se desea predecir la tasa dedivorcios con base en la tasa dematrimonios,¿Cuál es la variableindependiente?

3. Con base en el diagrama dedispersión ,¿parece existir algunarelación entre la tasa dematrimonios y la tasa dedivorcios?.

4. Determine la ecuación deregresión con la formula ydespués con el programa Excel.

Año Tasa de

matrimonios

Tasa de

divorcios

1905 10.0 0.8

1925 10.3 1.5

1935 10.4 1.7

1945 12.2 3.5

1955 9.3 2.3

1965 9.3 2.5

1975 10.1 4.9

1985 10.2 5.0

Page 26: Apuntes Clase Estadistica Ii(Itsz)

Año Grado de

responsabilidad

Tasa de

divorcios

1905 10.0 0.8

1925 10.3 1.5

1935 10.4 1.7

1945 12.2 3.5

1955 9.3 2.3

1965 9.3 2.5

1975 10.1 4.9

1985 10.2 5.0

x y x2 xy y2

Page 27: Apuntes Clase Estadistica Ii(Itsz)

Resultados de las autoridades en el combate a ladelincuencia. Se han presentado cifras oficiales yno oficiales que confirman el importanteincremento de la actividad delictiva en nuestropaís. Dado que el problema de inseguridad enMéxico está adquiriendo una dimensión cada vezmayor, imponiéndole un importante costo a lasociedad, la inseguridad se ha convertido paramuchos mexicanos en el principal reto del país. Porello es necesario evaluar si los esfuerzos realizadosen los últimos años por las autoridadesresponsables han tenido algún efecto en el controly combate de la delincuencia o se hace necesarioun cambio en las estrategias hasta ahorautilizadas.

Page 28: Apuntes Clase Estadistica Ii(Itsz)

Recursos

invertidos en

MMP =

X

Índice de

Criminalidad

(presuntos

delincuentes

por cada

100000 hab.)

= Y

X2 Y2 XY

2000 159

4000 160

6000 158

8000 160

10000 160

20000 160

Page 29: Apuntes Clase Estadistica Ii(Itsz)

Mes Temperatura promedio mes Numero de violaciones

Enero 14° 6

Febrero 16° 15

Marzo 22° 21

Abril 25° 20

Mayo 32° 45

Junio 31° 42

Julio 26° 37

Agosto 28° 40

Septiembre 25° 31

Octubre 21° 18

Noviembre 15° 12

Diciembre 12° 5

Encuentra la ecuación de regresión para los siguientes datos:

Page 30: Apuntes Clase Estadistica Ii(Itsz)

La recta de regresión representa nuestra mejorestimación de los datos Y a partir de los valores deX correspondientes. Sin embargo, a menos que larelación entre X y Y sea perfecta, la mayor parte delos reales de Y no estarán sobre la línea deregresión.

Así pues, cuando la relación es imperfecta,necesariamente habrá errores, en la predicción yserá útil conocer la magnitud de éstos.

Page 31: Apuntes Clase Estadistica Ii(Itsz)

La medición de los errores de predicción requiere el calculo del error estándar de la estimación. Este error es similar a la desviación estándar.

Estadísticas de la regresión

Coeficiente de correlación múltiple 0.85558115

Coeficiente de determinación R^2 0.7320191

R^2 ajustado 0.70522101

Error típico 0.43380824

Observaciones 12

Page 32: Apuntes Clase Estadistica Ii(Itsz)

m, es la pendiente de la recta de regresión

b, es la ordenada al origen

Error estándar de la estimación al predecir Y dado X

2

)()(/

2

n

XYmYbYxSy

Page 33: Apuntes Clase Estadistica Ii(Itsz)

Aplicación

Para el siguiente ejercicio encontrar (tabla anexa en la siguiente diapositiva)

1. Coeficiente de correlación2. Coeficiente de determinación3. m= pendiente4. b= ordenada al origen5. Ecuación de regresión y=m x +b6. Grafico de dispersión.7. Error estándar de estimación8. Si un alumno tiene un coeficiente intelectual de 141, cual será la

calificación estimada de acuerdo a la formula de regresión.9. Grafica la ecuación de regresión, toma los valores de x de la

tabla y para los de “y” toma los que salen de aplicar la formula de regresión.

2

)()(/

2

n

XYmYbYxSy

Page 34: Apuntes Clase Estadistica Ii(Itsz)

Estudiante Nº CI coeficiente intelectual

Promedio calificaciones

Y de acuerdo a la ecuación de regresióny=m x + b

1 110 1.0

2 112 1.6

3 118 1.2

4 119 2.1

5 122 2.6

6 125 1.8

7 127 2.6

8 130 2.0

9 132 3.2

10 134 2.6

11 136 3.0

12 138 3.6

Page 35: Apuntes Clase Estadistica Ii(Itsz)
Page 36: Apuntes Clase Estadistica Ii(Itsz)

El error estándar de estimación es una medida válida para utilizarlaal fijar intervalos de confianza cuando el tamaño de la muestra esgrande, y en alguna forma la dispersión con respecto a la recta deregresión está distribuida de manera normal.

Cuando el tamaño muestral es muy pequeño, debe introducirse unfactor de corrección para una muestra pequeña.

Un intervalo de confianza se determinará para:

◦ El valor medio de Y para un valor dado de X

◦ Un valor individual de Y para un valor dado de X

Para el primer caso:

2

2

)(

)(1).(´

x

x

nxSytY

Page 37: Apuntes Clase Estadistica Ii(Itsz)

En donde:

Y´ es el valor pronosticado para cualquier valor X seleccionado.

X es cualquier valor seleccionado de X

μ es la media de las x

n es el número de observaciones

Sy.x es el error estándar de la estimación (error típico)

t es el valor t tomado de la tabla t student, para n-2 grados de libertad.

Page 38: Apuntes Clase Estadistica Ii(Itsz)

Probabilidad de una sola cola.Valores t de Student y probabilidad P asociadaen función de los grados de libertad gl.

Si deseas, la probabilidad de dos colas, multiplica por dos esta fila

Page 39: Apuntes Clase Estadistica Ii(Itsz)

Para el siguiente problema, determinar el error estándar deestimación (error típico), pronosticar los valores de Y' enbase a la ecuación de regresión y los limites de confianzapara un valor de x=6 y una Y´ pronosticada de 8 con un95% de confianza.

vendedor Puntuación de prueba x

Real Y PronosticadaY´

Limite inferior

Limite superior

Arturo 4 5

Jorge 7 12

Saúl 3 4

Marco 6 8 8

Gonzalo 10 11

Total 30 40

Puedes usar Excel paradeterminar la ecuación deregresión y el error estándarde estimación

Page 40: Apuntes Clase Estadistica Ii(Itsz)

Respuesta: los limites de confianza de 95% para el valor de Y´ de 8 son 5.9 y 10.05

Interpretación: para una x=6, existe una probabilidad de 0.95de que sus ventas promedio semanales estén en el intervaloentre $5.9 y $10.05

Page 41: Apuntes Clase Estadistica Ii(Itsz)

Ejercicios de repaso:Dadas las siguientes matrices:

a. Encuentra el orden de las matrices A, B, C y D

b. ¿Cuál es el orden del producto AD?c. Multiplica A por Dd. Multiplica B por Ce. ¿Cuál es el orden del producto BC?f. Encuentra AT

g. Encuentra x, y, z, w 10

23

2

1

81

54

31

D

C

B

A

10

01

42

11

wz

yx

Page 42: Apuntes Clase Estadistica Ii(Itsz)

Operaciones con Matrices en Excel

Dadas las siguientes matrices, contesta las preguntas y encuentra lo que se te pide:

4

2

2

1

1

Y

51

41

31

21

11

X

1.- ¿El orden de la matriz Y es?2.- ¿El orden de la matriz X, es?3.- ¿El orden de la matriz XT, es?4.- ¿El orden de la matriz XT X ?5.- Encuentra la inversa de la matriz X6.- Encuentra XT

7.- Multiplica estas dos matrices XT X8.- Multiplica la transpuesta de X por Y9.- Encuentra la inversa XT X

Page 43: Apuntes Clase Estadistica Ii(Itsz)

Ejercicio 3

Realiza las siguientes operaciones

1. AB2. AT

3. AAT

4. A-1

5. (AAT)-1

110

106

127

100

132

32101

00101

00031

21021

45011

B

A

Page 44: Apuntes Clase Estadistica Ii(Itsz)

El análisis de regresión múltiple estudia la relación de una variable dependiente con dos o más variables independientes.

El modelo de regresión múltiple toma la forma siguiente:

ppxxxy ...

22110

ECUACIÓN DE REGRESIÓN MÚLTIPLE ESTIMADA

ppxbxbxbby ...

22110

y gorrito, indica el valor estimado de y , variable dependiente.

Page 45: Apuntes Clase Estadistica Ii(Itsz)

Punto de datos

Valor de y x1 x2 … xk Error aleatorio

no observable

1 y1 X11 X12 … X1k ε1

2 y2 X21 X22 … X2k ε2

… … … … … …

n yn xn1 xn2 … xnk εk

El modelo lineal general se puede expresar en forma de matriz como:

Y=Xβ + ε

Page 46: Apuntes Clase Estadistica Ii(Itsz)

yn

y

y

y

Y

...

3

2

1

xnkxnxn

kxxx

kxxx

kxxx

X

...211

...............

3...32311

2...22211

1...12111

...

ˆ

ˆ

ˆ

ˆ2

1

0

n

...

3

2

1

El modelo lineal general se puede expresar en forma de matriz comoY=Xβ +ε

Page 47: Apuntes Clase Estadistica Ii(Itsz)

Ecuación de matrices de mínimos cuadrados (Ecuación de regresión)Ecuación de regresión aplicando matrices:

YXXXTT ˆ

Solución de mínimos cuadrados:Esta solución te da los valores de la pendiente y la ordenada al origen en el caso mas sencillo, en los demás casos te da los valores de β

YXXXTT 1

ˆ

Page 48: Apuntes Clase Estadistica Ii(Itsz)

Aplicación 1Encuentre la línea de mínimos cuadrados para los datos de compresión de aislante que se dan en la tabla.

Muestra Presión Compresión

x y

1 1 1

2 2 1

3 3 2

4 4 2

5 5 4

Page 49: Apuntes Clase Estadistica Ii(Itsz)

4

2

2

1

1

Y

51

41

31

21

11

X

Y=0.7x -0.1

Page 50: Apuntes Clase Estadistica Ii(Itsz)

Aplicación 2

Una compañía de electricidad quiere predecir el consumo mensual de energía eléctrica de un hogar en función del tamaño x de la casa y con base en el modelo:

2

210xxy

Tamaño de la casa Consumo mensual

X, Pies cuadrados Y , kilowatts hora

1,290 1,182

1,350 1,172

1,470 1,264

1,600 1,493

1,710 1,571

1,840 1,711

1,980 1,804

2,230 1,840

2,400 1,956

2,930 1,954

Page 51: Apuntes Clase Estadistica Ii(Itsz)

954,1

956,1

840,1

804,1

711,1

591,1

493,1

264,1

172,1

182,1

Y

1822500350,11

)290,1(290,112

X

Y=-1216+2.39893x-0.00045x2

Page 52: Apuntes Clase Estadistica Ii(Itsz)

Aplicación: (Tarea)Utilice el método de mínimos cuadrados para ajustar el modelo E(y)=β0 + β1x , a los seis puntos de datos que se indican en la tabla.

x 1 2 3 4 5 6

y 1 2 2 3 5 5

a. Construya la matriz Y y Xb. Calcule XTX y XTYc. Utilice el software para verificar que

35

2

35

735

7

15

13

1

XXT

d. Obtenga la matriz β (matriz solución del sistema.

e. Determine la ecuación de predicción

Page 53: Apuntes Clase Estadistica Ii(Itsz)

Tarea:

Crear un video, con alguno de los temas visto en clase, donde seexplique el tema, este tema ira dirigido a los alumnos, para explicarel tema seleccionado, desde la parte básica, teoría, que utilidadtiene el tema, como lo aplico, con preguntas y respuestas, ejerciciode aplicación(2), conclusiones.

Esta tarea se hará en equipos de máximo 5 personas y tendrá valordentro del rubro de tareas.El video deberá subirse a la pagina de youtube, con el nombre deltema.Fecha limite para subirlo: 30 de Abril

Page 54: Apuntes Clase Estadistica Ii(Itsz)

Estimación de la varianza σ2 de ε(error) en un modelo de regresión múltiple.

Puesto que la varianza casi nunca se conoce por adelantado, debemos utilizar los datos muestra para estimar su valor.

s2 = (SSE)/(n – Número de parámetros β en el modelo)

Donde: ˆT T TSSE Y Y X Y

Por ejemplo para la diapositivaanterior, n=6 y como vas hacalcular solamente β0 y β1 ,entonces el número de parámetrosde beta es 2

Page 55: Apuntes Clase Estadistica Ii(Itsz)

RecordandoEncuentre la línea de mínimos cuadrados para los datos decompresión de aislante que se dan en la tabla. Después queya la encontraste, encuentra el valor de la varianza s2 y de ladesviación estándar.

Muestra Presión Compresión

x y

1 1 1

2 2 1

3 3 2

4 4 2

5 5 4

Y=0.7x -0.1

s2 = 0.367

Page 56: Apuntes Clase Estadistica Ii(Itsz)

)ˆ(ˆ2/ ii

estándarestimadoerrort

iiicst

2/ˆ

Donde tα/2 se basa en el número de grados de libertad asociados a s.

Para nuestro ejemplo anterior n=5 y los grados de libertad son n-2.Cuando nos dicen 95% de confianza, buscamos un 5% en la tabla (t student) dividido entre dos 0.05/2=0.025

Page 57: Apuntes Clase Estadistica Ii(Itsz)

¿Qué es cii ?

Por ejemplo, de la matriz

1.03.0

31.11

XXT

C00 =1.1 C11 =0.1

¿Qué es “s” ? Es la desviación estándar

Page 58: Apuntes Clase Estadistica Ii(Itsz)

AplicaciónEn una instalación de producción, es muy importante para lagerencia estimar con exactitud las horas/hombre requeridas parallevar a cabo una tarea, a fin de tomar decisiones como el númerocorrecto de obreros que debe contratar, la fecha de entrega que debeproponer al cliente, o decisiones de análisis de costos relativas a lospresupuestos. Un fabricante de tambores para calderas quiereutilizar regresión para predecir el número de horas/hombrenecesarias para erigir los tambores en proyectos futuros. Con estefin, recabo datos para 35 calderas. Además de las horas/hombre (y),las variables que se midieron fueron la capacidad de la caldera (X1,en lb/h), la presión diseñada la caldera (X2, en libras por pulgadacuadrada)

Page 59: Apuntes Clase Estadistica Ii(Itsz)

Tipo de caldera (X3=1 si es para la industria, 0 si es para servicios) y tipo de tambor (X4=1 si es vapor de agua, 0 si es de lodo). Los datos se proporcionan en la siguiente tabla (consulta el archivo de Excel)

a. Encuentre la ecuación de regresión para este modelo con 4 variables

b. En base a la ecuación anterior , predice , cuantas horas hombre le llevara producir una caldera de 130,000 lb/hr, presión de 375 libras por pulgada cuadrada, Industrial, para uso Vapor.

c. Encuentra la desviación estándar para β0

d. Establece un intervalo de confianza de 95% para β0

Realiza lo anterior, en una hoja de Excel, grábalo y envíalo como tarea.

Page 60: Apuntes Clase Estadistica Ii(Itsz)

Probabilidad de una sola cola.Valores t de Student y probabilidad P asociadaen función de los grados de libertad gl.

Si deseas, la probabilidad de dos colas, multiplica por dos esta fila

Page 61: Apuntes Clase Estadistica Ii(Itsz)

El error estándar de la estimación en el análisis de regresión múltiple mide el error para valores de Y con respecto al plano de regresión, si intervienen dos variables independientes.

1

)́()12.(

2

kn

YYSy

n= número de datos

k= número de parámetros de los cuales depende “y”O sea, de cuantos valores depende Y, puede ser que Y dependa solo de X1, pero también puede depender de X1, X2

Page 62: Apuntes Clase Estadistica Ii(Itsz)

Vendedor Puntuaciónde prueba

X1

Calificación de

desempeñoX2

Ventas semanales

Y

Ventas semanalesPronosticad

asY´

Y-Y´ (Y-Y´)2

Arturo 4 2 5 5.35

Arnulfo 7 5 12

Saúl 3 1 4

Marco 6 4 8

Gonzalo 10 6 11 11

2.65

Cálculos necesarios para obtener el error estándar múltiple de la estimación.

Sy.12= 1.151

Completar la tabla y encontrar el error estándar de estimación.

n=5k=2

Page 63: Apuntes Clase Estadistica Ii(Itsz)

Familia de diseños para comparar tratamientos.

Diseño complementario al azar y ANOVA.

Comparaciones o pruebas de rangos múltiples.

Verificación de los supuestos del modelo.

Elección del tamaño de muestra.

Page 64: Apuntes Clase Estadistica Ii(Itsz)

ANOVA

Page 65: Apuntes Clase Estadistica Ii(Itsz)

Suponga que renuncio el gerente de la sucursaloeste de una empresa dedicada a comercializarartículos de limpieza y se considera que tresvendedores pueden ocupar ese puesto. Los trestienen la misma antigüedad, educación, etc. Paratomar una decisión, se sugirió examinar losregistros de ventas mensuales de cada uno, en la

siguiente tabla se muestran sus registros.

Page 66: Apuntes Clase Estadistica Ii(Itsz)

Qué prueba la ANOVA

La prueba se basa en la idea de que si las muestrasprovienen de la misma población, la varianza de la muestracombinada deberá ser igual a las varianzas de las muestrasindividuales, dado que el nivel y la dispersión seránhomogéneos.En cambio, si las poblaciones de las que vienen la muestrasson diferentes (y tienen niveles diferentes), la varianza de lacombinación será mayor que las varianzas individuales.La prueba ANOVA usa las varianzas para evaluar lasignificación separando, por un lado, la varianza entremuestras y por otro lado, la varianza al interior de lasmuestras.

Page 67: Apuntes Clase Estadistica Ii(Itsz)

Sra.

Lourdes

Sr.

Gabriel

Sr.

Manuel

15 15 19

10 10 12

9 12 16

5 11 16

16 12 17

Media

muestral

11 12 16

Page 68: Apuntes Clase Estadistica Ii(Itsz)

x1 x12 x2 x2

2 x3 x32

15 … 15 … 19

10 … 10 … 12

9 … 12 … 16

5 … 11 … 16

16 … 12 … 17

Tc … … … … 195

nc … … 5 …

∑x2 … 734 1306 2727

Page 69: Apuntes Clase Estadistica Ii(Itsz)

x1 x12 x2 x2

2 x3 x32

15 225 15 225 19 361

10 100 10 100 12 144

9 81 12 144 16 256

5 25 11 121 16 256

16 256 12 144 17 289

Tc 55 60 80 195

nc 5 5 5 15

∑x2 687 734 1306 2727

Page 70: Apuntes Clase Estadistica Ii(Itsz)

SST = ∑ [ Tc2 / nc ] – (∑ x)2 / N

Page 71: Apuntes Clase Estadistica Ii(Itsz)

SST = ∑ [ Tc2 / nc ] – (∑ x)2 / N

= [ (55)2 /5 + … ] – (195)2 /15

= 2605 – 2535

= 70

Page 72: Apuntes Clase Estadistica Ii(Itsz)

SSE = ∑ (x2) - ∑ [ Tc2 / nc ]

Page 73: Apuntes Clase Estadistica Ii(Itsz)

SSE = ∑ (x2) - ∑ [ Tc2 / nc ]

= (15)2 + (10)2 +…+(17)2 - [ (55)2/5 + (60)2/5 + (80)2/5 ]

= 2727 – 2605

= 122

Page 74: Apuntes Clase Estadistica Ii(Itsz)

SST = 70SSE = 122K = Numero de tratamientos (vendedores) = 3N = Numero total de observaciones=15

Page 75: Apuntes Clase Estadistica Ii(Itsz)

Paso 1:

Hipótesis nula: Ho expresa que no hay diferencia significativa entre las ventas medias de los tres vendedores.

µ1 = µ2 = µ3

Page 76: Apuntes Clase Estadistica Ii(Itsz)

Paso 2: Elegir el nivel de significación:para este ejemplo se eligió el nivel 0.05

Page 77: Apuntes Clase Estadistica Ii(Itsz)

Fuente de

variación

Suma de

cuadrados

Grados

de

libertad

Cuadrado

medio

Entre

tratamientos

SST K-1 SST/ K-1 = MSTR

En los

tratamientos

SSE N-K SSE/ N-K = MSE

Total Total SS F = MSTR / MSE

Page 78: Apuntes Clase Estadistica Ii(Itsz)

La regla de decisión indica que si el valorcalculado de F es menor que o igual al valorcritico de 3.89, la hipótesis nula se acepta.

Nota: el valor critico lo obtienes de la tabla F,consultar el archivo adjunto de la tabla deFisher.

Región de rechazo

Page 79: Apuntes Clase Estadistica Ii(Itsz)

1. Compare2. Multiple Samples3. Multiple-sample

Comparison…4. OK5. Seleccionas tus

tres variables a comparar

6. Luego le das clic en el : ►

7. OK

¿Cómo lo hago en el Statgraphics.?

Primero captura tus datos en columnas, cada categoría en una columna.

Page 80: Apuntes Clase Estadistica Ii(Itsz)
Page 81: Apuntes Clase Estadistica Ii(Itsz)

En el desarrollo de un nuevo producto alimenticio sedesea comparar el efecto del tipo de envase yproceso de envasado (asociado al tipo de envase)sobre la vida de anaquel del producto. Existen trestipos de envases. Surgen algunas preguntas.

Page 82: Apuntes Clase Estadistica Ii(Itsz)

¿Cuántos artículos envasados con cada tipo de envasecomparar?¿Cómo seleccionar los envases?¿Existe diferencia estadística entre los días de duración,usando los diferentes tipos de envase?Nota: No es lo mismo decir que las medias de las muestrasson diferentes a decir que existe evidencia estadística de quelas medias de las muestras son diferentes.

Page 83: Apuntes Clase Estadistica Ii(Itsz)

A continuación se muestra un ejemplo, donde se muestrean trestipos de envases y se determinan los días de duración.

Los datos obtenidos se muestran en la tabla siguiente

Factor: Tipo de

envase y envasado

Respuesta: Díaz de duración Media

A 23, 28, 21, 27, 35, 41, 37, 30, 32, 36 31

B 35, 36, 29, 40, 43, 49, 51, 28, 50, 52 41.3

C 50, 43, 36, 34, 45, 52, 52, 43, 44, 34 43.3

Aplicación

Page 84: Apuntes Clase Estadistica Ii(Itsz)

Plantea la hipótesis nula y la hipótesis alternativa.

Ho:

Ha:

Realiza la ANOVA, utilizando el statgraphics. ( Pega aquí la ANOVA)

¿Estadísticamente hay diferencia entre los tipos de envase ? ¿Cuál es el valor de p-value?

“Si estadísticamente hay diferencia entre las medias de los días de duración cuando se usan los diferentes tipos de envase, entonces

ahora se utiliza otro tipo de prueba estadística para conocer cual de ellos es el mejor o si no hay diferencia entre ellos.”

Esta prueba estadística se llama “Mínima diferencia significativa” LSD

Page 85: Apuntes Clase Estadistica Ii(Itsz)

Para usar el procedimiento de la LSD, simplemente se comparan las diferencias observadas entre cada par de promedios (medias) con el valor correspondiente de la LSD.

Si

/ Xi - Xj / > LSD , se concluye que las medias poblacionales µi y µj son diferentes.

¿Qué es Xi , Xj ?Son las medias del tiempo de duración para cada uno de

los tratamientos (Tipo de envase y envasado)

LSD = tα/2, N-a √ SME (1/ ni + 1/ nj)

¿Qué son cada una de estas variables?

Page 86: Apuntes Clase Estadistica Ii(Itsz)

LSD = Esta es la constante que vas ha calcular y que se va ha servir como parámetro de comparación.

tα/2 , N-a = Valor que se obtiene de la tabla de la “distribución t”

α = Nivel de Significancia

N = Total de datos

a = Numero de Tratamientos.

SME = Cuadrado Medio de error en los tratamientos ( esta información se obtiene con la ANOVA)

ni , nj = Numero de datos en cada tratamiento

Page 87: Apuntes Clase Estadistica Ii(Itsz)

PRIMERO: Calculas la media de cada uno de los tratamientos

¿Cuál es la media para el tratamiento A? ________ ¿Cuál es la media para el tratamiento B? ________ ¿Cuál es la media para el tratamiento C? ________

SEGUNDO: Encuentras el valor absoluto de la diferencia de cada par de medias

Para este caso A-B, A-C, B-C

¡Ya no te acuerdas que es el valor absoluto! ¡A que bárbaro!

A - B = / 31 – 41.3 / = 10.3

B - C =

A - C =

Page 88: Apuntes Clase Estadistica Ii(Itsz)

TERCERO: Encuentras la t de student para tα/2 alfa = 0.05 y N-a = 30- 3= 27 utiliza las tablas de la distribución t.

CUARTO: Encuentras SME que es el cuadrado medio de error en los tratamientos (esta información la tienes en tu ANOVA)

QUINTO: Encuentras el LSD.

CONCLUSIONES E INTERPRETACION

Para tus conclusiones apóyate en esto: / Xi - Xj / > LSD , se concluye que las medias poblacionales µi y µj

son diferentes.

Page 89: Apuntes Clase Estadistica Ii(Itsz)

AHORA UTILIZA EL STATGRAPHICS, PARA REALIZAR ESTE PROCEDIMIENTO:

1. COMPARE

2. MULTIPLE SAMPLES

3. MULTIPLE SAMPLE COMPARISON

4. TABULAR OPTION (BOTON AMARILLO LADO IZQUIERDO)

5. SELECCIONA LA ANOVA Y LA PRUEBA MULTIPLE RANGE TESTS

Guarda tus resultados en una hoja de Word y envíala como tarea, correspondiente a este tema.

Page 90: Apuntes Clase Estadistica Ii(Itsz)

Una prueba es de una cola cuando la hipótesis alterna, H1,establece una dirección, como:H0 : el ingreso medio de las mujeres es menor o igual alingreso medio de los hombres.H1 : el ingreso medio de las mujeres es mayor que el de loshombres.

Distribución de muestreo para el valor estadístico z, pruebade una cola, nivel de significancia de .05

Page 91: Apuntes Clase Estadistica Ii(Itsz)

Una prueba es de dos colas cuando no se establece unadirección específica de la hipótesis alterna H1, como:

H0 : el ingreso medio de las mujeres es igual al ingreso mediode los hombres.H1 : el ingreso medio de las mujeres no es igual al ingresomedio de los hombres.

Distribución de muestreo para el valor estadístico z, pruebade dos colas, nivel de significancia de 0.05

Dos regiones de 0.025

Page 92: Apuntes Clase Estadistica Ii(Itsz)

Diseños en bloques completos al azar.

Diseño de cuadro latino.

Diseño de cuadro grecolatino

Page 93: Apuntes Clase Estadistica Ii(Itsz)

En cualquier experimento, la variabilidad quesurge de un factor perturbador puede afectar losresultados. En general, un factor perturbadorpuede definirse como un factor del diseño queprobablemente tenga un efecto sobre larespuesta, pero en el que no existe un interésespecifico. En ocasiones un factor perturbador esdesconocido y no controlable; es decir sedesconoce la existencia de ese factor e inclusopuede tener niveles variables mientras se estárealizando el experimento.

Page 94: Apuntes Clase Estadistica Ii(Itsz)

La aleatorización es la técnica de diseño que seutiliza para protegerse contra estos factoresperturbadores “que siempre están amenazandonuestros experimentos”. En otros casos, el factorperturbador es conocido pero no controlable.Cuando la fuente de variabilidad perturbadora esconocida y controlable, puede usarse una técnicade diseño llamada formación de bloques paraeliminar de manera sistemática su efecto sobrelas comparaciones estadísticas entre lostratamientos.

Page 95: Apuntes Clase Estadistica Ii(Itsz)

La formación de bloques es una técnica de diseño enextremo importante que se utiliza ampliamente en laexperimentación industrial.

En muchos experimentos además de que me interesainvestigar la influencia de un factor controlado sobre lavariable de respuesta, existe una fuente de variaciónadicional (bloque) que puede y debe ser sistematizada ycontrolada durante el experimento, con el propósito dedisminuir el error experimental y obtener mejoresconclusiones sobre el factor controlado.

De esta manera el error experimental se reducirá, y laprecisión del diseño aumentará.

Page 96: Apuntes Clase Estadistica Ii(Itsz)

Fuente de

Variación

Suma de

Cuadrados

Grados de

libertad

Cuadrado medio F

Tratamientos SSTratamientos a-1 MST =SSTratamientos/ a-1 MST/ MSE

Bloques

(factor

perturbador)

SSBloques b-1 SSBloques/ b-1

Error

SSE (a-1)(b-1) MSE =SSE / (a -1)(b –1)

Total

SST N-1

Análisis de Varianza de un diseño de bloques completos aleatorizado

Page 97: Apuntes Clase Estadistica Ii(Itsz)

a = Numero de tratamientosb = Numero de bloquesN = Total de datos muestreados = a b

b aSCT = ∑ ∑ Yij2 - Y2

../Nj =1 i =1

SCTRAT = ∑ Yi2/b - Y2../N

SCBLOQUE = ∑ Yj2/a - Y2

../N

SCERROR = SCT - SCTRAT - SCBLOQUE

Page 98: Apuntes Clase Estadistica Ii(Itsz)

Conceptos básicos en diseños factoriales.

Diseños factoriales con dos factores.

Diseños factoriales con tres factores.

Diseño factorial general

Modelos de efectos aleatorios.

Page 99: Apuntes Clase Estadistica Ii(Itsz)
Page 100: Apuntes Clase Estadistica Ii(Itsz)

En muchos experimentos interviene elestudio de los efectos de dos o másfactores. En general, los diseños factorialesson los mas eficientes para este tipo deexperimentos. Por diseño factorial seentiende que en cada ensayo o réplicacompleta del experimento se investigantodas las combinaciones posibles de losniveles de los factores.

Page 101: Apuntes Clase Estadistica Ii(Itsz)

Por ejemplo, si el factor A tiene “a” niveles yel factor B tiene “b” niveles, cada replicacontiene todas las ab combinaciones de lostratamientos. Cuando los factores estanincluidos en un diseño factorial, es comúndecir que están “cruzados”.

Page 102: Apuntes Clase Estadistica Ii(Itsz)

Un ingeniero está diseñando una batería que seusará en un dispositivo que se someterá avariaciones de temperatura extremas. El únicoparámetro del diseño que puede seleccionar eneste punto es el material de la placa o ánodo dela batería, y tiene tres elecciones posibles.Cuando el dispositivo esté fabricado y se envié alcampo, el ingeniero no tendrá control sobre lastemperaturas extremas en las que operará eldispositivo.

Page 103: Apuntes Clase Estadistica Ii(Itsz)

El ingeniero decide probar tres materiales de laplaca con tres niveles de temperatura que sonconsistentes con el medio ambiente donde seusará finalmente el producto. Se prueban cuatrobaterías con cada combinación del material de laplaca y la temperatura, y las 36 pruebas se corrende manera aleatoria.

Page 104: Apuntes Clase Estadistica Ii(Itsz)

¿Cuáles son los factores?

¿Cada factor cuantos niveles maneja?

Menciona las diferentes combinaciones o tratamientos.

¿Qué harías para correr este experimento en orden aleatorio?

¿Cuántas replicas se hicieron?

Page 105: Apuntes Clase Estadistica Ii(Itsz)

NO PASES A LA SIGUIENTE LAMINA

SI NO CONTESTASTES

LAS PREGUNTAS ANTERIORES

Page 106: Apuntes Clase Estadistica Ii(Itsz)

El efecto de un factor se define como elcambio en la respuesta producido por uncambio en el nivel del factor. Confrecuencia se le llama “efecto principal”porque se refiere a los factores de interésprimario en el experimento.