Apuntes Clase Estadistica Ii(Itsz)

Post on 03-Jul-2015

18.661 views 4 download

Transcript of Apuntes Clase Estadistica Ii(Itsz)

MII. ING. EDGAR JAVIER SILVA

Examen escrito

65%

Practicas ,tareas, participación y evaluación continua

35%

Probabilidad y Estadística Douglas C. Montgomery Mc Graw Hill

Probabilidad y Estadística para Ingeniería y Ciencias Mendenhall Prentice Hall

Diseño de Experimentos, Douglas C. Montgomery

http://mathworld.wolfram.com/classroom/classes/ProbabilityandStatistics.html

Regresión lineal simple.

Prueba de hipótesis en la regresión lineal simple.

Calidad del ajuste en regresión lineal simple.

Estimación y predicción por intervalo en regresión lineal simple.

Regresión lineal múltiple.

Pruebas de hipótesis en regresión lineal múltiple.

Intervalos de confianza y predicción en regresión múltiple.

¿Existe alguna relación entre el grado de oscuridad nocturna, la temperatura ambiente y el apetito de los ratones?

¿Existe alguna relación entre el numero de homicidios y el grado de estudios alcanzados en los diferentes municipios?

Para investigar la correlación entre dosvariables, en estadística se han creado loscoeficientes de correlación que permitenexpresar cuantitativamente el grado derelación que existe entre las dos variables.

Operativos que se

implentan en el mes.

Numero de automóviles

robados

2 10

3 15

4 20

5 25

6 30

7 34

2; 10

3; 15

4; 20

5; 25

6; 30

7; 35

0

5

10

15

20

25

30

35

40

0 2 4 6 8

Operativos

au

tom

ovil

es r

ob

ad

os

Serie1

-1 0 +1Correlación Negativa Correlación Positiva

No hay

0

2

4

6

8

10

12

14

16

18

0 2 4 6 8

Serie1

r= +0.8

0

2

4

6

8

10

12

14

16

18

0 2 4 6 8

Serie1

r = -0.7

0

5

10

15

20

25

30

35

40

0 2 4 6 8

Serie1

r = 0

CORRELACIÓN VALOR O RANGO

Perfecta |R| = 1

Excelente 0.9 <= |R| < 1

Buena 0.8 <= |R| < 0.9

Regular 0.5 <= |R| <0.8

Mala |R|< 0.5

r = n(ΣXY) – (ΣX)(ΣY)

√ [n(ΣX2) – (ΣX)2][n(ΣY2) – (ΣY)2]

n es el número de pares de observaciones.

Σx es la suma de valores de la variable x

Σy es la suma de valores de la variable y

X Y X2 XY Y2

2 10

3 15

4 20

5 25

6 30

7 34

27

Numero de

anuncios por

hora

X

Ventas

semanales

Y

X2 XY Y2

4 5

7 12

3 4

6 8

10 11

30 40 210 274 370

Coeficiente de determinación: es la proporción dela variación total en la variable dependiente Y quese explica por, o se debe a, la variación en lavariable independiente X

r2 = coeficiente de determinación

Dibuja la siguiente ecuación.

Y =2X +3 x y

0

1

2

3

Damos valores X para

encontrar los correspondient

es de Y

Y = 3X + 5 x y

0

1

2

m =

b =

Numero de

anuncios por

hora

X

Ventas

semanales

Y

X2 XY Y2

4 5

7 12

3 4

6 8

10 11

30 40 210 274 370

¿Cuál es la diferencia entre un grafico de dispersión y la ecuación de regresión?

m = pendiente de la recta

b= ordenada al origen

22)()(

))(()(

XXn

YXXYnm

)/(/ nXmnYb

Se tiene interés en examinar latasa de matrimonios y dedivorcios por millar dehabitantes en Tijuana para añosseleccionados. Las tasas para 8años, según el encargado de losmunicipios son:

1. Trace un diagrama de dispersiónlocalizando la tasa dematrimonios en el eje x , y latasa de divorcios en el eje y.

2. Si se desea predecir la tasa dedivorcios con base en la tasa dematrimonios,¿Cuál es la variableindependiente?

3. Con base en el diagrama dedispersión ,¿parece existir algunarelación entre la tasa dematrimonios y la tasa dedivorcios?.

4. Determine la ecuación deregresión con la formula ydespués con el programa Excel.

Año Tasa de

matrimonios

Tasa de

divorcios

1905 10.0 0.8

1925 10.3 1.5

1935 10.4 1.7

1945 12.2 3.5

1955 9.3 2.3

1965 9.3 2.5

1975 10.1 4.9

1985 10.2 5.0

Año Grado de

responsabilidad

Tasa de

divorcios

1905 10.0 0.8

1925 10.3 1.5

1935 10.4 1.7

1945 12.2 3.5

1955 9.3 2.3

1965 9.3 2.5

1975 10.1 4.9

1985 10.2 5.0

x y x2 xy y2

Resultados de las autoridades en el combate a ladelincuencia. Se han presentado cifras oficiales yno oficiales que confirman el importanteincremento de la actividad delictiva en nuestropaís. Dado que el problema de inseguridad enMéxico está adquiriendo una dimensión cada vezmayor, imponiéndole un importante costo a lasociedad, la inseguridad se ha convertido paramuchos mexicanos en el principal reto del país. Porello es necesario evaluar si los esfuerzos realizadosen los últimos años por las autoridadesresponsables han tenido algún efecto en el controly combate de la delincuencia o se hace necesarioun cambio en las estrategias hasta ahorautilizadas.

Recursos

invertidos en

MMP =

X

Índice de

Criminalidad

(presuntos

delincuentes

por cada

100000 hab.)

= Y

X2 Y2 XY

2000 159

4000 160

6000 158

8000 160

10000 160

20000 160

Mes Temperatura promedio mes Numero de violaciones

Enero 14° 6

Febrero 16° 15

Marzo 22° 21

Abril 25° 20

Mayo 32° 45

Junio 31° 42

Julio 26° 37

Agosto 28° 40

Septiembre 25° 31

Octubre 21° 18

Noviembre 15° 12

Diciembre 12° 5

Encuentra la ecuación de regresión para los siguientes datos:

La recta de regresión representa nuestra mejorestimación de los datos Y a partir de los valores deX correspondientes. Sin embargo, a menos que larelación entre X y Y sea perfecta, la mayor parte delos reales de Y no estarán sobre la línea deregresión.

Así pues, cuando la relación es imperfecta,necesariamente habrá errores, en la predicción yserá útil conocer la magnitud de éstos.

La medición de los errores de predicción requiere el calculo del error estándar de la estimación. Este error es similar a la desviación estándar.

Estadísticas de la regresión

Coeficiente de correlación múltiple 0.85558115

Coeficiente de determinación R^2 0.7320191

R^2 ajustado 0.70522101

Error típico 0.43380824

Observaciones 12

m, es la pendiente de la recta de regresión

b, es la ordenada al origen

Error estándar de la estimación al predecir Y dado X

2

)()(/

2

n

XYmYbYxSy

Aplicación

Para el siguiente ejercicio encontrar (tabla anexa en la siguiente diapositiva)

1. Coeficiente de correlación2. Coeficiente de determinación3. m= pendiente4. b= ordenada al origen5. Ecuación de regresión y=m x +b6. Grafico de dispersión.7. Error estándar de estimación8. Si un alumno tiene un coeficiente intelectual de 141, cual será la

calificación estimada de acuerdo a la formula de regresión.9. Grafica la ecuación de regresión, toma los valores de x de la

tabla y para los de “y” toma los que salen de aplicar la formula de regresión.

2

)()(/

2

n

XYmYbYxSy

Estudiante Nº CI coeficiente intelectual

Promedio calificaciones

Y de acuerdo a la ecuación de regresióny=m x + b

1 110 1.0

2 112 1.6

3 118 1.2

4 119 2.1

5 122 2.6

6 125 1.8

7 127 2.6

8 130 2.0

9 132 3.2

10 134 2.6

11 136 3.0

12 138 3.6

El error estándar de estimación es una medida válida para utilizarlaal fijar intervalos de confianza cuando el tamaño de la muestra esgrande, y en alguna forma la dispersión con respecto a la recta deregresión está distribuida de manera normal.

Cuando el tamaño muestral es muy pequeño, debe introducirse unfactor de corrección para una muestra pequeña.

Un intervalo de confianza se determinará para:

◦ El valor medio de Y para un valor dado de X

◦ Un valor individual de Y para un valor dado de X

Para el primer caso:

2

2

)(

)(1).(´

x

x

nxSytY

En donde:

Y´ es el valor pronosticado para cualquier valor X seleccionado.

X es cualquier valor seleccionado de X

μ es la media de las x

n es el número de observaciones

Sy.x es el error estándar de la estimación (error típico)

t es el valor t tomado de la tabla t student, para n-2 grados de libertad.

Probabilidad de una sola cola.Valores t de Student y probabilidad P asociadaen función de los grados de libertad gl.

Si deseas, la probabilidad de dos colas, multiplica por dos esta fila

Para el siguiente problema, determinar el error estándar deestimación (error típico), pronosticar los valores de Y' enbase a la ecuación de regresión y los limites de confianzapara un valor de x=6 y una Y´ pronosticada de 8 con un95% de confianza.

vendedor Puntuación de prueba x

Real Y PronosticadaY´

Limite inferior

Limite superior

Arturo 4 5

Jorge 7 12

Saúl 3 4

Marco 6 8 8

Gonzalo 10 11

Total 30 40

Puedes usar Excel paradeterminar la ecuación deregresión y el error estándarde estimación

Respuesta: los limites de confianza de 95% para el valor de Y´ de 8 son 5.9 y 10.05

Interpretación: para una x=6, existe una probabilidad de 0.95de que sus ventas promedio semanales estén en el intervaloentre $5.9 y $10.05

Ejercicios de repaso:Dadas las siguientes matrices:

a. Encuentra el orden de las matrices A, B, C y D

b. ¿Cuál es el orden del producto AD?c. Multiplica A por Dd. Multiplica B por Ce. ¿Cuál es el orden del producto BC?f. Encuentra AT

g. Encuentra x, y, z, w 10

23

2

1

81

54

31

D

C

B

A

10

01

42

11

wz

yx

Operaciones con Matrices en Excel

Dadas las siguientes matrices, contesta las preguntas y encuentra lo que se te pide:

4

2

2

1

1

Y

51

41

31

21

11

X

1.- ¿El orden de la matriz Y es?2.- ¿El orden de la matriz X, es?3.- ¿El orden de la matriz XT, es?4.- ¿El orden de la matriz XT X ?5.- Encuentra la inversa de la matriz X6.- Encuentra XT

7.- Multiplica estas dos matrices XT X8.- Multiplica la transpuesta de X por Y9.- Encuentra la inversa XT X

Ejercicio 3

Realiza las siguientes operaciones

1. AB2. AT

3. AAT

4. A-1

5. (AAT)-1

110

106

127

100

132

32101

00101

00031

21021

45011

B

A

El análisis de regresión múltiple estudia la relación de una variable dependiente con dos o más variables independientes.

El modelo de regresión múltiple toma la forma siguiente:

ppxxxy ...

22110

ECUACIÓN DE REGRESIÓN MÚLTIPLE ESTIMADA

ppxbxbxbby ...

22110

y gorrito, indica el valor estimado de y , variable dependiente.

Punto de datos

Valor de y x1 x2 … xk Error aleatorio

no observable

1 y1 X11 X12 … X1k ε1

2 y2 X21 X22 … X2k ε2

… … … … … …

n yn xn1 xn2 … xnk εk

El modelo lineal general se puede expresar en forma de matriz como:

Y=Xβ + ε

yn

y

y

y

Y

...

3

2

1

xnkxnxn

kxxx

kxxx

kxxx

X

...211

...............

3...32311

2...22211

1...12111

...

ˆ

ˆ

ˆ

ˆ2

1

0

n

...

3

2

1

El modelo lineal general se puede expresar en forma de matriz comoY=Xβ +ε

Ecuación de matrices de mínimos cuadrados (Ecuación de regresión)Ecuación de regresión aplicando matrices:

YXXXTT ˆ

Solución de mínimos cuadrados:Esta solución te da los valores de la pendiente y la ordenada al origen en el caso mas sencillo, en los demás casos te da los valores de β

YXXXTT 1

ˆ

Aplicación 1Encuentre la línea de mínimos cuadrados para los datos de compresión de aislante que se dan en la tabla.

Muestra Presión Compresión

x y

1 1 1

2 2 1

3 3 2

4 4 2

5 5 4

4

2

2

1

1

Y

51

41

31

21

11

X

Y=0.7x -0.1

Aplicación 2

Una compañía de electricidad quiere predecir el consumo mensual de energía eléctrica de un hogar en función del tamaño x de la casa y con base en el modelo:

2

210xxy

Tamaño de la casa Consumo mensual

X, Pies cuadrados Y , kilowatts hora

1,290 1,182

1,350 1,172

1,470 1,264

1,600 1,493

1,710 1,571

1,840 1,711

1,980 1,804

2,230 1,840

2,400 1,956

2,930 1,954

954,1

956,1

840,1

804,1

711,1

591,1

493,1

264,1

172,1

182,1

Y

1822500350,11

)290,1(290,112

X

Y=-1216+2.39893x-0.00045x2

Aplicación: (Tarea)Utilice el método de mínimos cuadrados para ajustar el modelo E(y)=β0 + β1x , a los seis puntos de datos que se indican en la tabla.

x 1 2 3 4 5 6

y 1 2 2 3 5 5

a. Construya la matriz Y y Xb. Calcule XTX y XTYc. Utilice el software para verificar que

35

2

35

735

7

15

13

1

XXT

d. Obtenga la matriz β (matriz solución del sistema.

e. Determine la ecuación de predicción

Tarea:

Crear un video, con alguno de los temas visto en clase, donde seexplique el tema, este tema ira dirigido a los alumnos, para explicarel tema seleccionado, desde la parte básica, teoría, que utilidadtiene el tema, como lo aplico, con preguntas y respuestas, ejerciciode aplicación(2), conclusiones.

Esta tarea se hará en equipos de máximo 5 personas y tendrá valordentro del rubro de tareas.El video deberá subirse a la pagina de youtube, con el nombre deltema.Fecha limite para subirlo: 30 de Abril

Estimación de la varianza σ2 de ε(error) en un modelo de regresión múltiple.

Puesto que la varianza casi nunca se conoce por adelantado, debemos utilizar los datos muestra para estimar su valor.

s2 = (SSE)/(n – Número de parámetros β en el modelo)

Donde: ˆT T TSSE Y Y X Y

Por ejemplo para la diapositivaanterior, n=6 y como vas hacalcular solamente β0 y β1 ,entonces el número de parámetrosde beta es 2

RecordandoEncuentre la línea de mínimos cuadrados para los datos decompresión de aislante que se dan en la tabla. Después queya la encontraste, encuentra el valor de la varianza s2 y de ladesviación estándar.

Muestra Presión Compresión

x y

1 1 1

2 2 1

3 3 2

4 4 2

5 5 4

Y=0.7x -0.1

s2 = 0.367

)ˆ(ˆ2/ ii

estándarestimadoerrort

iiicst

2/ˆ

Donde tα/2 se basa en el número de grados de libertad asociados a s.

Para nuestro ejemplo anterior n=5 y los grados de libertad son n-2.Cuando nos dicen 95% de confianza, buscamos un 5% en la tabla (t student) dividido entre dos 0.05/2=0.025

¿Qué es cii ?

Por ejemplo, de la matriz

1.03.0

31.11

XXT

C00 =1.1 C11 =0.1

¿Qué es “s” ? Es la desviación estándar

AplicaciónEn una instalación de producción, es muy importante para lagerencia estimar con exactitud las horas/hombre requeridas parallevar a cabo una tarea, a fin de tomar decisiones como el númerocorrecto de obreros que debe contratar, la fecha de entrega que debeproponer al cliente, o decisiones de análisis de costos relativas a lospresupuestos. Un fabricante de tambores para calderas quiereutilizar regresión para predecir el número de horas/hombrenecesarias para erigir los tambores en proyectos futuros. Con estefin, recabo datos para 35 calderas. Además de las horas/hombre (y),las variables que se midieron fueron la capacidad de la caldera (X1,en lb/h), la presión diseñada la caldera (X2, en libras por pulgadacuadrada)

Tipo de caldera (X3=1 si es para la industria, 0 si es para servicios) y tipo de tambor (X4=1 si es vapor de agua, 0 si es de lodo). Los datos se proporcionan en la siguiente tabla (consulta el archivo de Excel)

a. Encuentre la ecuación de regresión para este modelo con 4 variables

b. En base a la ecuación anterior , predice , cuantas horas hombre le llevara producir una caldera de 130,000 lb/hr, presión de 375 libras por pulgada cuadrada, Industrial, para uso Vapor.

c. Encuentra la desviación estándar para β0

d. Establece un intervalo de confianza de 95% para β0

Realiza lo anterior, en una hoja de Excel, grábalo y envíalo como tarea.

Probabilidad de una sola cola.Valores t de Student y probabilidad P asociadaen función de los grados de libertad gl.

Si deseas, la probabilidad de dos colas, multiplica por dos esta fila

El error estándar de la estimación en el análisis de regresión múltiple mide el error para valores de Y con respecto al plano de regresión, si intervienen dos variables independientes.

1

)́()12.(

2

kn

YYSy

n= número de datos

k= número de parámetros de los cuales depende “y”O sea, de cuantos valores depende Y, puede ser que Y dependa solo de X1, pero también puede depender de X1, X2

Vendedor Puntuaciónde prueba

X1

Calificación de

desempeñoX2

Ventas semanales

Y

Ventas semanalesPronosticad

asY´

Y-Y´ (Y-Y´)2

Arturo 4 2 5 5.35

Arnulfo 7 5 12

Saúl 3 1 4

Marco 6 4 8

Gonzalo 10 6 11 11

2.65

Cálculos necesarios para obtener el error estándar múltiple de la estimación.

Sy.12= 1.151

Completar la tabla y encontrar el error estándar de estimación.

n=5k=2

Familia de diseños para comparar tratamientos.

Diseño complementario al azar y ANOVA.

Comparaciones o pruebas de rangos múltiples.

Verificación de los supuestos del modelo.

Elección del tamaño de muestra.

ANOVA

Suponga que renuncio el gerente de la sucursaloeste de una empresa dedicada a comercializarartículos de limpieza y se considera que tresvendedores pueden ocupar ese puesto. Los trestienen la misma antigüedad, educación, etc. Paratomar una decisión, se sugirió examinar losregistros de ventas mensuales de cada uno, en la

siguiente tabla se muestran sus registros.

Qué prueba la ANOVA

La prueba se basa en la idea de que si las muestrasprovienen de la misma población, la varianza de la muestracombinada deberá ser igual a las varianzas de las muestrasindividuales, dado que el nivel y la dispersión seránhomogéneos.En cambio, si las poblaciones de las que vienen la muestrasson diferentes (y tienen niveles diferentes), la varianza de lacombinación será mayor que las varianzas individuales.La prueba ANOVA usa las varianzas para evaluar lasignificación separando, por un lado, la varianza entremuestras y por otro lado, la varianza al interior de lasmuestras.

Sra.

Lourdes

Sr.

Gabriel

Sr.

Manuel

15 15 19

10 10 12

9 12 16

5 11 16

16 12 17

Media

muestral

11 12 16

x1 x12 x2 x2

2 x3 x32

15 … 15 … 19

10 … 10 … 12

9 … 12 … 16

5 … 11 … 16

16 … 12 … 17

Tc … … … … 195

nc … … 5 …

∑x2 … 734 1306 2727

x1 x12 x2 x2

2 x3 x32

15 225 15 225 19 361

10 100 10 100 12 144

9 81 12 144 16 256

5 25 11 121 16 256

16 256 12 144 17 289

Tc 55 60 80 195

nc 5 5 5 15

∑x2 687 734 1306 2727

SST = ∑ [ Tc2 / nc ] – (∑ x)2 / N

SST = ∑ [ Tc2 / nc ] – (∑ x)2 / N

= [ (55)2 /5 + … ] – (195)2 /15

= 2605 – 2535

= 70

SSE = ∑ (x2) - ∑ [ Tc2 / nc ]

SSE = ∑ (x2) - ∑ [ Tc2 / nc ]

= (15)2 + (10)2 +…+(17)2 - [ (55)2/5 + (60)2/5 + (80)2/5 ]

= 2727 – 2605

= 122

SST = 70SSE = 122K = Numero de tratamientos (vendedores) = 3N = Numero total de observaciones=15

Paso 1:

Hipótesis nula: Ho expresa que no hay diferencia significativa entre las ventas medias de los tres vendedores.

µ1 = µ2 = µ3

Paso 2: Elegir el nivel de significación:para este ejemplo se eligió el nivel 0.05

Fuente de

variación

Suma de

cuadrados

Grados

de

libertad

Cuadrado

medio

Entre

tratamientos

SST K-1 SST/ K-1 = MSTR

En los

tratamientos

SSE N-K SSE/ N-K = MSE

Total Total SS F = MSTR / MSE

La regla de decisión indica que si el valorcalculado de F es menor que o igual al valorcritico de 3.89, la hipótesis nula se acepta.

Nota: el valor critico lo obtienes de la tabla F,consultar el archivo adjunto de la tabla deFisher.

Región de rechazo

1. Compare2. Multiple Samples3. Multiple-sample

Comparison…4. OK5. Seleccionas tus

tres variables a comparar

6. Luego le das clic en el : ►

7. OK

¿Cómo lo hago en el Statgraphics.?

Primero captura tus datos en columnas, cada categoría en una columna.

En el desarrollo de un nuevo producto alimenticio sedesea comparar el efecto del tipo de envase yproceso de envasado (asociado al tipo de envase)sobre la vida de anaquel del producto. Existen trestipos de envases. Surgen algunas preguntas.

¿Cuántos artículos envasados con cada tipo de envasecomparar?¿Cómo seleccionar los envases?¿Existe diferencia estadística entre los días de duración,usando los diferentes tipos de envase?Nota: No es lo mismo decir que las medias de las muestrasson diferentes a decir que existe evidencia estadística de quelas medias de las muestras son diferentes.

A continuación se muestra un ejemplo, donde se muestrean trestipos de envases y se determinan los días de duración.

Los datos obtenidos se muestran en la tabla siguiente

Factor: Tipo de

envase y envasado

Respuesta: Díaz de duración Media

A 23, 28, 21, 27, 35, 41, 37, 30, 32, 36 31

B 35, 36, 29, 40, 43, 49, 51, 28, 50, 52 41.3

C 50, 43, 36, 34, 45, 52, 52, 43, 44, 34 43.3

Aplicación

Plantea la hipótesis nula y la hipótesis alternativa.

Ho:

Ha:

Realiza la ANOVA, utilizando el statgraphics. ( Pega aquí la ANOVA)

¿Estadísticamente hay diferencia entre los tipos de envase ? ¿Cuál es el valor de p-value?

“Si estadísticamente hay diferencia entre las medias de los días de duración cuando se usan los diferentes tipos de envase, entonces

ahora se utiliza otro tipo de prueba estadística para conocer cual de ellos es el mejor o si no hay diferencia entre ellos.”

Esta prueba estadística se llama “Mínima diferencia significativa” LSD

Para usar el procedimiento de la LSD, simplemente se comparan las diferencias observadas entre cada par de promedios (medias) con el valor correspondiente de la LSD.

Si

/ Xi - Xj / > LSD , se concluye que las medias poblacionales µi y µj son diferentes.

¿Qué es Xi , Xj ?Son las medias del tiempo de duración para cada uno de

los tratamientos (Tipo de envase y envasado)

LSD = tα/2, N-a √ SME (1/ ni + 1/ nj)

¿Qué son cada una de estas variables?

LSD = Esta es la constante que vas ha calcular y que se va ha servir como parámetro de comparación.

tα/2 , N-a = Valor que se obtiene de la tabla de la “distribución t”

α = Nivel de Significancia

N = Total de datos

a = Numero de Tratamientos.

SME = Cuadrado Medio de error en los tratamientos ( esta información se obtiene con la ANOVA)

ni , nj = Numero de datos en cada tratamiento

PRIMERO: Calculas la media de cada uno de los tratamientos

¿Cuál es la media para el tratamiento A? ________ ¿Cuál es la media para el tratamiento B? ________ ¿Cuál es la media para el tratamiento C? ________

SEGUNDO: Encuentras el valor absoluto de la diferencia de cada par de medias

Para este caso A-B, A-C, B-C

¡Ya no te acuerdas que es el valor absoluto! ¡A que bárbaro!

A - B = / 31 – 41.3 / = 10.3

B - C =

A - C =

TERCERO: Encuentras la t de student para tα/2 alfa = 0.05 y N-a = 30- 3= 27 utiliza las tablas de la distribución t.

CUARTO: Encuentras SME que es el cuadrado medio de error en los tratamientos (esta información la tienes en tu ANOVA)

QUINTO: Encuentras el LSD.

CONCLUSIONES E INTERPRETACION

Para tus conclusiones apóyate en esto: / Xi - Xj / > LSD , se concluye que las medias poblacionales µi y µj

son diferentes.

AHORA UTILIZA EL STATGRAPHICS, PARA REALIZAR ESTE PROCEDIMIENTO:

1. COMPARE

2. MULTIPLE SAMPLES

3. MULTIPLE SAMPLE COMPARISON

4. TABULAR OPTION (BOTON AMARILLO LADO IZQUIERDO)

5. SELECCIONA LA ANOVA Y LA PRUEBA MULTIPLE RANGE TESTS

Guarda tus resultados en una hoja de Word y envíala como tarea, correspondiente a este tema.

Una prueba es de una cola cuando la hipótesis alterna, H1,establece una dirección, como:H0 : el ingreso medio de las mujeres es menor o igual alingreso medio de los hombres.H1 : el ingreso medio de las mujeres es mayor que el de loshombres.

Distribución de muestreo para el valor estadístico z, pruebade una cola, nivel de significancia de .05

Una prueba es de dos colas cuando no se establece unadirección específica de la hipótesis alterna H1, como:

H0 : el ingreso medio de las mujeres es igual al ingreso mediode los hombres.H1 : el ingreso medio de las mujeres no es igual al ingresomedio de los hombres.

Distribución de muestreo para el valor estadístico z, pruebade dos colas, nivel de significancia de 0.05

Dos regiones de 0.025

Diseños en bloques completos al azar.

Diseño de cuadro latino.

Diseño de cuadro grecolatino

En cualquier experimento, la variabilidad quesurge de un factor perturbador puede afectar losresultados. En general, un factor perturbadorpuede definirse como un factor del diseño queprobablemente tenga un efecto sobre larespuesta, pero en el que no existe un interésespecifico. En ocasiones un factor perturbador esdesconocido y no controlable; es decir sedesconoce la existencia de ese factor e inclusopuede tener niveles variables mientras se estárealizando el experimento.

La aleatorización es la técnica de diseño que seutiliza para protegerse contra estos factoresperturbadores “que siempre están amenazandonuestros experimentos”. En otros casos, el factorperturbador es conocido pero no controlable.Cuando la fuente de variabilidad perturbadora esconocida y controlable, puede usarse una técnicade diseño llamada formación de bloques paraeliminar de manera sistemática su efecto sobrelas comparaciones estadísticas entre lostratamientos.

La formación de bloques es una técnica de diseño enextremo importante que se utiliza ampliamente en laexperimentación industrial.

En muchos experimentos además de que me interesainvestigar la influencia de un factor controlado sobre lavariable de respuesta, existe una fuente de variaciónadicional (bloque) que puede y debe ser sistematizada ycontrolada durante el experimento, con el propósito dedisminuir el error experimental y obtener mejoresconclusiones sobre el factor controlado.

De esta manera el error experimental se reducirá, y laprecisión del diseño aumentará.

Fuente de

Variación

Suma de

Cuadrados

Grados de

libertad

Cuadrado medio F

Tratamientos SSTratamientos a-1 MST =SSTratamientos/ a-1 MST/ MSE

Bloques

(factor

perturbador)

SSBloques b-1 SSBloques/ b-1

Error

SSE (a-1)(b-1) MSE =SSE / (a -1)(b –1)

Total

SST N-1

Análisis de Varianza de un diseño de bloques completos aleatorizado

a = Numero de tratamientosb = Numero de bloquesN = Total de datos muestreados = a b

b aSCT = ∑ ∑ Yij2 - Y2

../Nj =1 i =1

SCTRAT = ∑ Yi2/b - Y2../N

SCBLOQUE = ∑ Yj2/a - Y2

../N

SCERROR = SCT - SCTRAT - SCBLOQUE

Conceptos básicos en diseños factoriales.

Diseños factoriales con dos factores.

Diseños factoriales con tres factores.

Diseño factorial general

Modelos de efectos aleatorios.

En muchos experimentos interviene elestudio de los efectos de dos o másfactores. En general, los diseños factorialesson los mas eficientes para este tipo deexperimentos. Por diseño factorial seentiende que en cada ensayo o réplicacompleta del experimento se investigantodas las combinaciones posibles de losniveles de los factores.

Por ejemplo, si el factor A tiene “a” niveles yel factor B tiene “b” niveles, cada replicacontiene todas las ab combinaciones de lostratamientos. Cuando los factores estanincluidos en un diseño factorial, es comúndecir que están “cruzados”.

Un ingeniero está diseñando una batería que seusará en un dispositivo que se someterá avariaciones de temperatura extremas. El únicoparámetro del diseño que puede seleccionar eneste punto es el material de la placa o ánodo dela batería, y tiene tres elecciones posibles.Cuando el dispositivo esté fabricado y se envié alcampo, el ingeniero no tendrá control sobre lastemperaturas extremas en las que operará eldispositivo.

El ingeniero decide probar tres materiales de laplaca con tres niveles de temperatura que sonconsistentes con el medio ambiente donde seusará finalmente el producto. Se prueban cuatrobaterías con cada combinación del material de laplaca y la temperatura, y las 36 pruebas se corrende manera aleatoria.

¿Cuáles son los factores?

¿Cada factor cuantos niveles maneja?

Menciona las diferentes combinaciones o tratamientos.

¿Qué harías para correr este experimento en orden aleatorio?

¿Cuántas replicas se hicieron?

NO PASES A LA SIGUIENTE LAMINA

SI NO CONTESTASTES

LAS PREGUNTAS ANTERIORES

El efecto de un factor se define como elcambio en la respuesta producido por uncambio en el nivel del factor. Confrecuencia se le llama “efecto principal”porque se refiere a los factores de interésprimario en el experimento.