Trabajo Final Anova-dca y Dbca Liliii

62
1 “AÑO DE LA INVERSIÓN PARA EL DESARROLLO RURAL Y LA SEGURIDAD ALIMENTARIA” FACULTAD DE CIENCIAS ADMINISTRATIVAS CURSO: ESTADISTICA II. DOCENTE: MARIELA CORDOVA ESPINOZA GRUPO: Nº 04 ALUMNA : CANTARO ALVARADO JENIFER FACUNDO AGUIRRE JHOSSELIN

Transcript of Trabajo Final Anova-dca y Dbca Liliii

Page 1: Trabajo Final Anova-dca y Dbca Liliii

1

“AÑO DE LA INVERSIÓN PARA EL DESARROLLO RURAL Y LA SEGURIDAD ALIMENTARIA”

FACULTAD DE CIENCIAS ADMINISTRATIVAS

CURSO: ESTADISTICA II.

DOCENTE: MARIELA CORDOVA ESPINOZA

GRUPO: Nº 04

ALUMNA :

CANTARO ALVARADO JENIFERFACUNDO AGUIRRE JHOSSELINJUAREZ MONTALVAN MARIELALIZAMA GARCIA JAVIERQUEVEDO TICLIAHUANCA JULLSEMINARIO TUME LILIANA.

Page 2: Trabajo Final Anova-dca y Dbca Liliii

2

INTRODUCCIÓN.

El desarrollo de nuevas tecnologías dentro del proceso productivo, sea este de tipo agropecuario o de tipo industrial, surge del proceso de investigación. De aquí la importancia de los diseños experimentales en la generación de información confiable.

El diseño estadístico de experimentos se refiere al proceso para planear el experimento de tal forma que se recaben datos adecuados que puedan analizarse con métodos estadísticos que lleven a conclusiones válidas y objetivas. Cuando el problema incluye datos que están sujetos a errores experimentales, la metodología estadística es el único enfoque objetivo de análisis. Por lo tanto, cualquier experimento incluye dos aspectos: El diseño del experimento y el análisis estadístico de los datos.

Es común que durante el proceso de investigación se utilicen diseños experimentales no adecuados, es decir que no responden al objetivo de la investigación y por lo tanto, su análisis estadístico también será equivocado, por lo que se llegan a conclusiones erradas, cuando esto ocurre la investigación no tiene ninguna validez.En el presente documento se hace una breve reseña de lo que son los diseños experimentales de uso más común COMO EL ANOVA, DCA Y DBCA..

Page 3: Trabajo Final Anova-dca y Dbca Liliii

3

DISEÑOS EXPERIMENTALES.

El diseño experimental es el arreglo de las unidades experimentales utilizado para controlar el error experimental, a la vez que acomoda los tratamientos.El ogro de la máxima información, precisión y exactitud en los resultados, junto con el uso más eficiente de los recursos existentes, es un principio a seguir en la elección del diseño adecuado del experimento.

La selección de un determinado diseño en un experimento depende del objetivo de la investigación, de los factores a evaluar y de las fuentes de variación que deseamos disminuir para aumentar la precisión del experimento, es decir disminuir el error experimental.

ELEMENTOS ESTRUCTURALES DEL EXPERIMENTO DE CAMPO

EXPERIMENTO. Se define como una prueba o serie de pruebas en la cual se hacen cambios deliberados en las variables de entrada de un proceso o sistema para observar e identificar las razones de los cambios que puedan observarse en la respuesta de salida.

TRATAMIENTOS Son todos los factores objeto de estudio. Ej. Variedades, Razas, Factores de manejo, Niveles de nutrientes, Raciones de concentrado, Épocas de siembre, etc.

Ejemplo 1:

Si en un experimento en la cual se desea medir el consumo de alimento y la ganancia de peso en cerdos alimentados con diferentes dietas, si cada cerdo está en un corral individual y los tratamientos se aplican de forma individual a cada cerdo, la unidad experimental es el cerdo. Pero si se tienen cuatro cerdos en un mismo corral la unidad experimental es el corral y no cada uno de los cerdos. Esto porque no se tiene un control individual de la variable de respuestas que se está evaluando, por lo tanto, es al corral al cual se le están aplicando los tratamientos. En el primer caso si se quieren tener cinco repeticiones, se tendría un total de cinco cerdos, alojados de forma individual en cada tratamiento. En el segundo caso como la unidad experimental es el corral, se necesitarán cinco corrales con cuatro cerdos cada uno, cada corral con cuatro cerdos es una repetición, es decir se necesitarían 20 cerdos por tratamiento.

LOS TRATAMIENTOS DE CONTROL SON UN PUNTO DE REFERENCIA

Page 4: Trabajo Final Anova-dca y Dbca Liliii

4

El tratamiento de control es un punto necesario para evaluar el efecto de los tratamientos experimentales; existen diversas circunstancias en las que el tratamiento control es útil y necesario.Las condiciones del experimento pueden ser un obstáculo para la efectividad de los tratamientos experimentales que, en general han sido efectivos. Un control al que no se da tratamiento revelara las condiciones en las que se efectuó el experimento. Por ejemplo, los fertilizantes con nitrógeno suelen ser efectivos, pero no producirán respuestas en suelos con alta fertilidad. Un control de fertilizante sin nitrógeno señalara las condiciones básicas de fertilidad del experimento.

Unidad experimental.

Se refiere al individuo, lugar o parcela a la cual se le aplican los tratamientos. Ej: Una planta, un conjunto de plantas, un animal, un conjunto de animales, La parcela experimental, Varias parcelas en zonas diferentes.

Repeticiones Número de veces que se repite el experimento básico.

Defensas internas y externas A partir de estas se origina la parcela útil, definen la parcela experimental

Variable . Es una característica medible de una unidad experimental.

Muestra. Conjunto de mediciones que constituye parte de una población.

Muestra aleatoria . Es aquella en la cual en cualquier medición individual tiene tantas posibilidades de ser incluida como cualquier otra.

Error experimental . Es un error estadístico e indica que se origina por la variación que no está bajo control.

Los distintos orígenes del error experimental son:

1) La variación natural entre las unidades experimentales

2) La variabilidad en la medición de la respuesta

3) La imposibilidad de reproducir las condiciones del tratamiento con exactitud

de una unidad a otra

4) La interacción de los tratamientos con las unidades experimentales

5) Cualquier otro factor externo que influya en las características medidas

Prueba de hipótesis o prueba de significancia . Es una técnica de la inferencia estadística que permite que las comparaciones se hagan de forma objetiva.

Page 5: Trabajo Final Anova-dca y Dbca Liliii

5

La hipótesis de investigación genera el diseño de los tratamientos La hipótesis de investigación establece un conjunto de circunstancias y sus consecuencias. Los tratamientos son la creación de las circunstancias para el experimento. Así, es importante identificar los tratamientos con el papel que cada uno tiene en la evaluación de la hipótesis de investigación. Si no se logra delinear con claridad esta hipótesis y el objetivo del estudio, puede haber dificultades en la selección de los tratamientos y experimentos sin éxitoEs forzoso que el investigador se asegure de que los tratamientos elegidos concuerden con la hipótesis de investigación.

ANALISIS DE VARIANZA (ANOVA)

El análisis de varianza es una técnica que se puede utilizar para decidir

si las medias de dos o más poblaciones son iguales. La prueba se basa

en una muestra única, obtenida a partir de cada población.

El análisis de varianza puede servir para determinar si las diferencias

entre las medias muestrales revelan las verdaderas diferencias entre los

valores medios de cada una de las poblaciones, o si las diferencias

entre los valores medios de la muestra son más indicativas de una

variabilidad de muestreo.

Si el valor estadístico de prueba (análisis de varianza) nos impulsa a

aceptar la hipótesis nula, se concluiría que las diferencias observadas

entre las medias de las muestras se deben a la variación casual en el

muestreo (y por tanto, que los valores medios de población son iguales).

Si se rechaza la hipótesis nula, se concluiría que las diferencias entre

los valores medios de la muestra son demasiado grandes como para

deberse únicamente a la casualidad (y por ello, no todas las medias de

población son iguales).

Los datos para el análisis de varianza se obtienen tomando una muestra de

cada población y calculando la media muestral y la variancia en el caso de

cada muestra.

Existen tres supuestos básicos que se deben satisfacer antes de que se

Page 6: Trabajo Final Anova-dca y Dbca Liliii

6

pueda utilizar el análisis de variancia.

1) Las muestras deben ser de tipo aleatorio independiente.

2) Las muestras deben ser obtenidas a partir de poblaciones normales.

3) Las poblaciones deben tener variancias iguales (es decir, )

Uno de los requisitos para realizar este temas es saber la Prueba F- de Fisher

y para ello vamos a dar una pequeña reseña teórica de esta dicha prueba.

PRUEBA F DE FISHER:

A diferencia de otras pruebas de medias que se basan en la diferencia

existente entre dos valores, el análisis de varianza emplea la razón de las

estimaciones, dividiendo la estimación intermediante entre la estimación

interna

Esta razón F fue creada por Ronald Fisher (1890-1962), matemático británico,

cuyas teorías estadísticas hicieron mucho más precisos los experimentos

científicos. Sus proyectos estadísticos, primero utilizados en biología,

rápidamente cobraron importancia y fueron aplicados a la experimentación

agrícola, médica e industrial. Fisher también contribuyó a clarificar las

funciones que desempeñan la mutación y la selección natural en la genética,

particularmente en la población humana.

El valor estadístico de prueba resultante se debe comparar con un valor tabular

de F, que indicará el valor máximo del valor estadístico de prueba que ocurría

si H0 fuera verdadera, a un nivel de significación seleccionado. Antes de

proceder a efectuar este cálculo, se debe considerar las características de la

distribución F:

Características de la distribución F

Permite valorar el efecto del azar.

Es una prueba estadística de significación usada en el análisis de los

tamaños pequeños categóricos de muestra de datos.

La necesidad de la prueba de Fischer se presenta cuando tenemos

datos que se dividan en dos categorías de dos maneras separadas.

Page 7: Trabajo Final Anova-dca y Dbca Liliii

7

Prueba de significación estadística utilizada para comparar proporciones

en tablas de contingencia.

Es preferible a la prueba de x2 cuando el tamaño de la muestra es reducido (de

menos de 30 efectivos).

Es la prueba estadística de elección cuando la prueba de Chi cuadrado no

puede ser empleada por tamaño muestral insuficiente

- Existe una distribución F diferente para cada combinación de tamaño de

muestra y número de muestras. Por tanto, existe una distribución F que se

aplica cuando se toman cinco muestras de seis observaciones cada una, al

igual que una distribución F diferente para cinco muestras de siete

observaciones cada una. A propósito de esto, el número distribuciones de

muestreo diferentes es tan grande que sería poco práctico hacer una extensa

tabulación de distribuciones. Por tanto, como se hizo en el caso de la

distribución t, solamente se tabulan los valores que más comúnmente se

utilizan. En el caso de la distribución F, los valores críticos para los niveles

0,05 y 0,01 generalmente se proporcionan para determinadas combinaciones

de tamaños de muestra y número de muestras.

- La distribución es continua respecto al intervalo de 0 a + ∞. La razón más

pequeña es 0. La razón no puede ser negativa, ya que ambos términos de la

razón F están elevados al cuadrado. Por otra parte, grandes diferencias entre

los valores medios de la muestra, acompañadas de pequeñas variancias

muéstrales pueden dar como resultado valores extremadamente grandes de la

razón F.- La forma de cada distribución de muestreo teórico F depende del

número de grados de libertad que estén asociados a ella. Tanto el numerador

como el denominador tienen grados de libertad relacionados.

Determinación de los grados de libertad

Los grados de libertad para el numerador y el denominador de la razón F se

basan en los cálculos necesarios para derivar cada estimación de la variancia

de la población. La estimación intermediante de variancia (numerador)

comprende la división de la suma de las diferencias elevadas al cuadrado entre

el número de medias (muestras) menos uno, o bien, k - 1. Así, k - 1 es el

Page 8: Trabajo Final Anova-dca y Dbca Liliii

8

número de grados de libertad para el numerador.

En forma semejante, el calcular cada variancia muestral, la suma de las

diferencias elevadas al cuadrado entre el valor medio de la muestra y cada

valor de la misma se divide entre el número de observaciones de la muestra

menos uno, o bien, n - 1. Por tanto, el promedio de las variancias muestrales

se determina dividiendo la suma de las variancias de la muestra entre el

número de muestras, o k. Los grados de libertad para el denominador son

entonces, k(n -l).

Uso de la tabla de F del análisis de variancia (ANOVA)

En la tabla se ilustra la estructura de una tabla de F para un nivel de

significación de 0,01 o 1% y 0,05 o 5%. Se obtiene el valor tabular, localizando

los grados de libertad del numerador (que se listan en la parte superior de la

tabla), así como los del denominador (que se listan en una de las columnas

laterales de la tabla) que corresponden a una situación dada. Utilizando el nivel

de significación de 0,05 para grados de libertad, el valor de F es 8,89

Page 9: Trabajo Final Anova-dca y Dbca Liliii

9

Ejemplos:

a. El área a la derecha de F, es de 0.25 con  =4 y  =9.

b. El área a la izquierda de F, es de 0.95 con  =15 y  =10.

Solución:

a. Como el área que da la tabla es de cero a Fisher, se tiene que localizar

primero los grados de libertad dos que son 9, luego un área de 0.75 con 4

grados de libertad uno.

b. En este caso se puede buscar el área de 0.95 directamente en la tabla

con sus respectivos grados de libertad.

Análisis de la vAN

ANÁLISIS DE VARIANZA PARA UN EXPERIMENTO REALIZADO MEDIANTE UN DISEÑO COMPLETAMENTE AL AZAR (DCA)

1. CARACTERÍSTICAS DEL DISEÑO.

Page 10: Trabajo Final Anova-dca y Dbca Liliii

10

En este tipo de diseño están incluidos los principios de repetición y de aleatorización, o sea que es utilizado cuando no hay necesidad del control local, debido a que el ambiente experimental es homogéneo, y los tratamientos reasignan a las unidades experimentales mediante una aleatorización completa, sin ninguna restricción.

2 ALEATORIZACIÓN.

Considerando un experimento con t = 5 niveles del factor A (tratamientos) y r = 4 y repeticiones par cada nivel, se tiene que el numero total de unidades experimentales (parcelas) incluidas en el experimento es t x r = 5 x 4 = 20. Las t x r parcelas serán aleatorizadas sin restricciones, los t niveles del factor A en estudio con sus r repeticiones, conforme se muestra en el siguiente croquis.

Las respuestas obtenidas en función de la aplicación de cada nivel del factor A en estudio en sus respectivas repeticiones puede ser representada por y ij , que es considerada como una variable aleatoria.

3. Modelo Estadístico.Y ij=μ+τ i+εij i = 1, 2,…, t j = 1, 2,…, r

siendo: y ij = variable de respuesta de la ij-ésima unidad experimental

μ = media general de la variable de respuesta.

τ i = efecto del i-ésimo tratamiento (nivel del factor) en la variable

dependiente.

ε ij = error experimental asociado a la ij-ésima unidad experimental.

4. Análisis de varianza.

1) Hipótesis:

H0 :μ1=μ2=μ3=⋯=μk

H1 :

no todas la medias son iguales

Dado que μi=μ

es equivalente a τ i=0

, para i = 1, 2,…, k, la hipótesis nula consiste también en afirmar que no hay efecto en todos los tratamientos, esto es,

A 1 A 4 A 3 A 5 A 2

A 4 A 2 A 1 A45 A 3

A 2 A 5 A 2 A 1 A 3

A 5 A 3 A 4 A 5 A 1

Page 11: Trabajo Final Anova-dca y Dbca Liliii

11

H0 :τ1=τ2=τ3=⋯=τ t=0

H1 :

Al menos uno de los τ i≠0

2) Tablas de datos

Representación de las observaciones de un experimento, con un factor con t tratamientos (o niveles) y r repeticiones.

Tabla 4.1. Datos de k muestras aleatorias independientes.

Y ¿⋅¿ ¿= y 1 . + y 2 . + + y 3i . + …..+ y k . = es el total de datos en las k muestras.Y ¿⋅¿ ¿= media total muestral (estimador insesgado de la media μ)

3) Supuestos.

Las suposiciones que validan el análisis de varianza son:a) Los errores son independientes.b) Los errores normalmente distribuidos con media cero y varianza

constante.c) Existe homogeneidad de varianzas entre los tratamientos.

4) Tabla de Análisis de Varianza (ANVA) El análisis de varianza es un proceso aritmético y estadístico, que consiste en descomponer la variación total en fuentes o causas de variación. Por variación total se entiende, la variación entre las unidades experimentales (o parcelas). El esquema del análisis de varianza y las expresiones necesarias para la aplicación de la estadística F, para la prueba de hipótesis se presentan en el siguiente cuadro.

Tabla de análisis de varianza (ANVA)

Fuentes devariación

Grados delibertad

Suma deCuadrados

CuadradosMedios

Valor de F

TratamientosError

k -1n-1

SCtratSCE

CMtrat =SCtrat / (k – 1) CME = SCE / k(r -1)

F= CMtrat / CME

Total n -1 SCT

Donde:

SCtrat=∑i=1

k

∑j=1

n i

( y ij− y¿⋅¿ )2 =∑

i=1

k Y i ⋅¿2

ni

−Y ¿⋅¿2

n¿¿¿

Repeticiones Tratamientos1 2 3 … k

y 11

y 12

y 13

.

.

.y 1 n1

y 221

y 22

y 23

.

.

.y 2 n2

y 31

y 32

y 33

.

.

.y 3 n3

………...

y k1

y k2

y t3

.

.

.y k nk

Totales Y i . y 1 . y 2 . y 3i . y k .

Page 12: Trabajo Final Anova-dca y Dbca Liliii

12

SCT=∑i=1

t

∑j=1

n i

( y ij− y¿⋅¿)2 =∑

i=1

k

∑j=1

ni

y ij2−

Y ¿⋅¿2

n¿¿

SCE = SCT – SCtrat

n=n1+n2+⋯+nk = el total observado en las k muestras

5) Regla de Decisión: Rechazar H 0 si el valor de F > F [α; k-1, n - 1]

No rechazar H 0 si el valor de F ≤ F [α; k-1, n - 1]

1 - α

α F 0 F [α; k-1, n - 1]

Aceptar H0 Rechazar H0

Coeficiente de variación (C.V)

Se le puede considerar como medida relativa de la variación que no es posible controlar en el experimento (error experimental) y se calcula de la siguiente forma:

C . V ( y )=√CMEy

×100

El coeficiente de variación da una idea de la precisión del experimento, a un valor alto de CV corresponde un alto error experimental, lo cual indica que existe poca capacidad del experimento para detectar diferencias significativas entre los tratamientos.

“De modo general, altos coeficientes de variación indican experimentos mal manejados”, pero no siempre. El hecho de que el coeficiente de variación sea alto puede deberse no solamente al mal manejo del experimento, sino también a:

Tipo de variable de respuesta (escala de medición) Tipo de tratamientos. Errores en el análisis de la información. Etc.

Es conveniente que el investigador revise bibliografía sobre los valores de coeficiente de variación obtenidos en cada cultivo y condición donde se realizó el experimento

Page 13: Trabajo Final Anova-dca y Dbca Liliii

13

(por ejemplo, un valor de CV =10% puede ser considerado un valor bajo, pero para algunas condiciones no).

Ventajas del diseño complemente al azar

Su flexibilidad. Puesto que permite una total libertad en el dispositivo experimental, por un lado, se puede probar cualquier número de tratamiento y, por otro lado, el número de observaciones por tratamiento puede ser igual o desigual.

Maximiza los grados de libertad para estimar el error experimental. Permite observaciones perdidas y no se dificulta el análisis estadístico. Muy fácil de usar una experimentación.

Desventajas del diseño completamente al azar Es apropiado para un número pequeño de tratamientos. Es apropiado solo en caso de disponer de material experimental homogéneo. En comparación con otros dispositivos experimentales donde se pueda ejercer

control local es menos sensible y tiene un poder analítico débil. Esta falta de sensibilidad se debe a que todos los factores que no se controlaron se acumulan en el error experimental, provocando que este aumente y no permita detectar diferencias significativas entre los tratamientos. Este es el motivo por el cual los investigadores estadígrafos se dedicaron a buscar diseños experimentales más complejos, pero que fueran capaz de estimar el error experimental con mayor grado de precisión.

Supuestos del ANOVA completamente al azar

Son cuatro los supuestos que debe cumplir el ANOVA, que se puede abreviar con la nemotécnica: HINA. La H de homogeneidad de las varianzas, I de independencia de los errores, la N de la normalidad de los efectos y la A de aditivita de los efectos:

o Homogeneidad de las varianzas se refiere a que cada respuesta Yij debe

poseer dentro de cada tratamiento una variación parecida o igual a la de otro tratamiento. Este supuesto puede ser probado postulando como hipótesis nula y alterna las siguientes

Para verificar el cumplimiento de este supuesto se utiliza la prueba de Bartlett o de Levene. La aplicación de estas pruebas debe conducir a un no rechazo de Ho para que exista la homogeneidad de varianzas.

Page 14: Trabajo Final Anova-dca y Dbca Liliii

14

o Independencia de los errores de un tratamiento a otro: es decir, se

calculan los errores residuales para cada grupo de tratamientos a través de la formula :

oERROR_RESIDUAL = Yi – XiLas hipótesis son:Ho: hay independencia de errores.H1 hay dependencia de errores.El supuesto de independencia se verifica su cumplimiento utilizando la prueba de aleatoriedad o de las rachas que es una prueba del ámbito no paramétrico.

o Normalidad de los efectos: se refiere a que las respuestas Yij deben poseer

una distribución normal dentro de cada grupo de tratamiento. Para verificar su cumplimiento se plantean las hipótesis:

Ho: la distribución de cada tratamiento es normalH1: la distribución de cada tratamiento no e normalLa prueba que utilizaremos en este caso es la de Shapiro- Wilk para muestras pequeñas y Kolmogorov –Smirnov para muestras grandes.

o Aditividad de los efectos: las respuestas de cada grupo de tratamiento es la

suma de la medida general más un efecto aleatorio asociado a la respuesta. El sistema hipotético es :

Ho: los efectos son aditivos H1: los efectos no son aditivosLa prueba estadística apropiada es la prueba de Tukey para la aditividad. Esta prueba debe conducir a un no rechazo de Ho para que el supuesto se cumpla.

EJERCICIOS DEL DCA

1. El administrador de la empresa de celulares esta a cargo del registro de numero de celulares que llegan a vender 4 trabajadores de la empresa diariamente. determinar si ambos trabajadores son igual de eficientes. A un nivel del 0.05

A B C D6 7 6 48 9 7 48 6 2 28 7 6 53 8 7 49 4 7 58 5 9 4

SOLUCIÓN:

A B C D

6 7 6 4

8 9 7 4

8 6 2 2

Page 15: Trabajo Final Anova-dca y Dbca Liliii

15

8 7 6 5

3 8 7 4

9 4 7 5

8 5 9 4

x i⋅¿ ¿ 50 46 44 28 168x i⋅¿ ¿ 7.14 6.57 6.29 4 6

1. Hipótesis :

H0 :μ1=μ2=μ3=μ4

H1 : No todas las medias son iguales2. Nivel de significancia: α = 0.05

3. Estadística de prueba: F=CMtrat

CME ~ F( r−1, n−r )=F(3 ,24 )

4. Cálculos: De los datos se obtiene:

SCtrat=∑i=1

k

∑j=1

n i

( x ij−x¿⋅¿ )2=∑

i=1

k X i ⋅¿2

k−

X¿⋅¿2

n=502+462 +442+282

4−1682

24=40 . 0 ¿¿¿

SCT=∑i=1

t

∑j=1

n i

( x ij−x¿⋅¿ )2 =∑

i=1

k

∑j=1

ni

x ij2−

X¿⋅¿2

n=62+72+⋯+42−1682

24=116. 0 ¿¿

SCE = SCT – Sctrat = 116.0 – 40.0 = 76.0

Análisis de la Varianza-------------------------------------------------------------------------------------------------------------Fuente Sumas de cuad. Gl Cuadrado Medio Cociente-F P-Valor-------------------------------------------------------------------------------------------------------------Tratamientos 40.0 3 13.3333 4.21 0.0158Error 76.0 24 3.16667-------------------------------------------------------------------------------------------------------------Total 116.0 27

Puesto que el p-valor del test F es inferior a 0.05, hay diferencia estadísticamente significativa en la eficacia de los trabajadores para un nivel de confianza del 95.0%.

TUKEY--------------------------------------------------------------------------------Método: 95.0 porcentaje HSD de TukeyTratamiento Frec. Media Grupos homogéneos--------------------------------------------------------------------------------4 7 4.0 X 3 7 6.28571 XX2 7 6.57143 XX1 7 7.14286 X--------------------------------------------------------------------------------Contraste Diferencias +/- Límites--------------------------------------------------------------------------------

Page 16: Trabajo Final Anova-dca y Dbca Liliii

16

1 - 2 0.571429 2.62463 1 - 3 0.857143 2.62463 1 - 4 *3.14286 2.62463 2 - 3 0.285714 2.62463 2 - 4 2.57143 2.62463 3 - 4 2.28571 2.62463 --------------------------------------------------------------------------------* indica una diferencia significativa.

El asterisco que se encuentra al lado de uno de los pares, indica que éste muestra diferencia estadísticamente significativa a un nivel de confianza 95.0%. En la parte superior de la página, se identifican 2 grupos homogéneos según la alineación del signo X en la columna. Dentro de cada columna, los niveles que tienen signo X forman un grupo de medias entre las cuales no hay diferencias estadísticamente significativas.

DUNCAN--------------------------------------------------------------------------------Método: 95.0 porcentaje DuncanTratamiento Frec. Media Grupos homogéneos--------------------------------------------------------------------------------4 7 4.0 X 3 7 6.28571 X2 7 6.57143 X1 7 7.14286 X--------------------------------------------------------------------------------Contraste Diferencias --------------------------------------------------------------------------------1 - 2 0.571429 1 - 3 0.857143 1 - 4 *3.14286 2 - 3 0.285714 2 - 4 *2.57143 3 - 4 *2.28571 --------------------------------------------------------------------------------* indica una diferencia significativa.

El asterisco que se encuentra al lado de los 3 pares, indica que éstos muestran diferencias estadísticamente significativas a un nivel de confianza 95.0%. En la parte superior de la página, se identifican 2 grupos homogéneos según la alineación del signo X en la columna. Dentro de cada columna, los niveles que tienen signo X forman un grupo de medias entre las cuales no hay diferencias estadísticamente significativas

Page 17: Trabajo Final Anova-dca y Dbca Liliii

17

2. Un banco hace esfuerzos para atraer nuevos depositantes, incluyen algunos juegos y premios en cuatro sucursales del banco. El administrador del banco esta convencido de que diferentes tipos de premios atraería a diferentes grupos de ingreso. La persona de un nivel de ingreso prefieren los regalos, mientras que los de otro grupo de ingreso prefieren los viajes gratuitos. El administrador del banco decide utilizar el monto de los depósitos entre las cuatro sucursales. Se determinar si existe diferencia en el nivel promedio de los depósitos entre las cuatro sucursales a un nivel de 5 %

Solución

Sucursal1 sucursal 2 sucursal3 sucursal 45.1 1.9 3.6 1.34.9 1.9 4.2 1.55.6 2.1 4.5 0.94.8 2.4 4.8 13.8 2.1 3.9 1.95.1 3.1 4.1 1.54.8 2.5 5.1 2.1

x i⋅¿ ¿ 34.1 16 30.2 10.2 90.5x i⋅¿ ¿ 4.87 2.29 4.31 1.46 3.23

1. Hipótesis :

H0 :μ1=μ2=μ3=μ4

H1 : No todas las medias son iguales2. Nivel de significancia: α = 0.05

3. Estadística de prueba: F=CMtrat

CME ~ F( r−1, n−r )=F(3 ,24 )

4. Cálculos: De los datos se obtiene:

SCtrat=∑i=1

k

∑j=1

n i

( x ij−x¿⋅¿ )2=∑

i=1

k X i ⋅¿2

k−

X¿⋅¿2

n¿¿¿

Sucursal 1 sucursal 2 sucursal3 sucursal 45.1 1.9 3.6 1.34.9 1.9 4.2 1.55.6 2.1 4.5 0.94.8 2.4 4.8 13.8 2.1 3.9 1.95.1 3.1 4.1 1.54.8 2.5 5.1 2.1

Page 18: Trabajo Final Anova-dca y Dbca Liliii

18

SCT=∑i=1

t

∑j=1

n i

( x ij−x¿⋅¿ )2 =∑

i=1

k

∑j=1

ni

x ij2−

X¿⋅¿2

n¿¿

SCE = SCT – Sctrat

Análisis de la Varianza---------------------------------------------------------------------------------------------------------------Fuente Sumas de cuad. Gl Cuadrado Medio Cociente-F P-Valor---------------------------------------------------------------------------------------------------------------Tratamientos 55.3325 3 18.4442 78.09 0.0000Error 5.66857 24 0.23619---------------------------------------------------------------------------------------------------------------Total 61.0011 27

El F-ratio, que en este caso es igual a 78.0902, es el cociente de la estimación entre grupos y la estimación dentro de los grupos. Puesto que el p-valor del test F es inferior a 0.05, hay diferencia estadísticamente significativa existe diferencia en el nivel promedio de los depósitos para un nivel de confianza del 95.0%.

Duncan--------------------------------------------------------------------------------Método: 95.0 porcentaje DuncanTratamiento Frec. Media Grupos homogéneos-------------------------------------------------------------------------------- 4 7 1.45714 X 2 7 2.28571 X 3 7 4.31429 X 1 7 4.87143 X--------------------------------------------------------------------------------Contraste Diferencias --------------------------------------------------------------------------------1 - 2 *2.58571 1 - 3 *0.557143 1 - 4 *3.41429 2 - 3 *-2.02857 2 - 4 *0.828571 3 - 4 *2.85714 --------------------------------------------------------------------------------* indica una diferencia significativa. El asterisco que se encuentra al lado de los 6 pares, indica que éstos muestran diferencias estadísticamente significativas a un nivel de confianza 95.0%.

Page 19: Trabajo Final Anova-dca y Dbca Liliii

19

3. El dueño de un empresa corporativa desea compara el precio de una máquina especializada para su proyecto, para ello decide asignar a su trabajador mas capacitado, esta función.

El trabajador selecciono 4 tiendas, las cuales ofrecían una mejor oferta. Los resultados fueron los siguientes.

A B C D

16 17 16 14

18 19 17 14

18 16 12 12

18 17 16 15

13 18 17 14

19 14 17 15

18 15 19 14

Al nivel de significancia de 0.05 ¿habría alguna diferencia en el precio promedio entre las 4 tiendas?

Solución:A B C D

16 17 16 14

18 19 17 14

18 16 12 12

18 17 16 15

13 18 17 14

19 14 17 15

18 15 19 14

x i⋅¿ ¿ 120 116 114 98 448

x i⋅¿ ¿ 17.14 16.57 16.29 14 16

1. Hipótesis :

H0 :μ1=μ2=μ3=μ4

H1 : No todas las medias son iguales2. Nivel de significancia: α = 0.05

3. Estadística de prueba: F=CMtrat

CME ~ F( r−1, n−r )=F(3 ,24 )

4. Cálculos: De los datos se obtiene:

Page 20: Trabajo Final Anova-dca y Dbca Liliii

20

SCtrat=∑i=1

k

∑j=1

n i

( xij−x¿⋅¿ )2=∑

i=1

k X i ⋅¿2

k−

X¿⋅¿2

n¿¿¿

SCT=∑i=1

t

∑j=1

n i

( x ij−x¿⋅¿ )2 =∑

i=1

k

∑j=1

ni

x ij2−

X¿⋅¿2

n¿¿

SCE = SCT – Sctrat

Análisis de la Varianza----------------------------------------------------------------------------------------------------------Fuente Sumas de cuad. Gl Cuadrado Medio Cociente-F P-Valor----------------------------------------------------------------------------------------------------------Entre grupos 40.0 3 13.3333 4.21 0.0158Intra grupos 76.0 24 3.16667----------------------------------------------------------------------------------------------------------Total 116.0 27

El F-ratio, que en este caso es igual a 4.21053, es el cociente de la estimación entre grupos y la estimación dentro de los grupos. Puesto que el p-valor del test F es inferior a 0.05, hay diferencia estadísticamente significativa en el precio promedio de las 4 tiendas para un nivel de confianza del 95.0%.

Tukey--------------------------------------------------------------------------------Método: 95.0 porcentaje HSD de TukeyTratamiento Frec. Media Grupos homogéneos-------------------------------------------------------------------------------- 4 7 14.0 X 3 7 16.2857 XX 2 7 16.5714 XX 1 7 17.1429 X--------------------------------------------------------------------------------Contraste Diferencias +/- Límites--------------------------------------------------------------------------------1 - 2 0.571429 2.62463 1 - 3 0.857143 2.62463 1 - 4 *3.14286 2.62463 2 - 3 0.285714 2.62463 2 - 4 2.57143 2.62463 3 - 4 2.28571 2.62463 --------------------------------------------------------------------------------* indica una diferencia significativa.El asterisco que se encuentra al lado de uno de los pares, indica que éste muestra diferencia estadísticamente significativa a un nivel de confianza 95.0%. En la parte superior de la página, se identifican 2 grupos homogéneos según la alineación del signo X en la columna. Dentro de cada columna, los niveles que tienen signo X forman un grupo de medias entre las cuales no hay diferencias estadísticamente significativas. Pero habiendo diferencia significativa en 4 y 1.

Page 21: Trabajo Final Anova-dca y Dbca Liliii

21

4. El administrador de la empresa “Watson SA” sospecha que en las diferentes áreas de la empresa no se están desenvolviendo satisfactoriamente, para ello decide hacer un análisis con la cantidad promedio de artículos vendidos para determinar si el personal de las diferentes áreas se desenvuelven satisfactoriamente por igual.

FotosA B C D89 88 97 9484 77 92 7981 87 87 8587 92 89 8479 81 80 88

Solución:

FotosA B C D

89 88 97 9484 77 92 7981 87 87 8587 92 89 8479 81 80 88

x i⋅¿ ¿ 420 425 445 430 1720x i⋅¿ ¿ 140.00 141.67 148.33 143.33 143.33

1. Hipótesis :

H0 :μ1=μ2=μ3=μ4

H1 : No todas las medias son iguales2. Nivel de significancia: α = 0.05

3. Estadística de prueba: F=CMtrat

CME ~ F( r−1, n−r )=F(3 ,24 )

4. Cálculos: De los datos se obtiene:

SCtrat=∑i=1

k

∑j=1

n i

( xij−x¿⋅¿ )2=∑

i=1

k X i ⋅¿2

k−

X¿⋅¿2

n¿¿¿

SCT=∑i=1

t

∑j=1

n i

( x ij−x¿⋅¿ )2 =∑

i=1

k

∑j=1

ni

x ij2−

X¿⋅¿2

n¿¿

Page 22: Trabajo Final Anova-dca y Dbca Liliii

22

SCE = SCT – Sctrat Análisis de la Varianza

-------------------------------------------------------------------------------------------------------Fuente Sumas de cuad. Gl Cuadrado Medio Cociente-F P-Valor-------------------------------------------------------------------------------------------------------Tratamientos 264.0 4 66.0 3.34 0.0380Error 296.0 15 19.7333-------------------------------------------------------------------------------------------------------Total 560.0 19

Puesto que el p-valor del test F es inferior a 0.05, hay diferencia estadísticamente significativa en el desenvolvimiento satisfactorio de las 4 áreas para un nivel de confianza del 95.0%. Para determinar las medias que son significativamente

Tukey--------------------------------------------------------------------------------Método: 95.0 porcentaje HSD de TukeyTratamientos Frec. Media Grupos homogéneos-------------------------------------------------------------------------------- 5 4 82.0 X 2 4 83.0 XX 3 4 85.0 XX 4 4 88.0 XX 1 4 92.0 X--------------------------------------------------------------------------------Contraste Diferencias +/- Límites--------------------------------------------------------------------------------1 - 2 9.0 9.73401 1 - 3 7.0 9.73401 1 - 4 4.0 9.73401 1 - 5 *10.0 9.73401 2 - 3 -2.0 9.73401 2 - 4 -5.0 9.73401 2 - 5 1.0 9.73401 3 - 4 -3.0 9.73401 3 - 5 3.0 9.73401 4 - 5 6.0 9.73401 --------------------------------------------------------------------------------* indica una diferencia significativa.El asterisco que se encuentra al lado de uno de los pares, indica que éste muestra diferencia estadísticamente significativa a un nivel de confianza 95.0%. En la parte superior de la página, se identifican 2 grupos homogéneos según la alineación del signo X en la columna. Dentro de cada columna, los niveles que tienen signo X forman un grupo de medias entre las cuales no hay diferencias estadísticamente significativas. Pero si existiendo diferencia significativa en 1 y 5.

5. Cuatro áreas de ventas tienen la tarea de generar la misma cantidad de ganancias, si el administrador obtuvo la siguiente planilla de 5 mes (miles de soles) determinar si las 4 áreas de ventas lograron cumplir con lo asignado.

A B C D49 48 57 54

Page 23: Trabajo Final Anova-dca y Dbca Liliii

23

44 37 52 3941 57 47 4537 52 49 4439 41 40 48

Solución:

A B C D49 48 57 5444 37 52 3941 57 47 4537 52 49 4439 41 40 48

x i⋅¿ ¿ 210 235 245 230 920x i⋅¿ ¿ 70.00 78.33 81.67 76.67 76.67

1. Hipótesis :

H0 :μ1=μ2=μ3=μ4

H1 : No todas las medias son iguales2. Nivel de significancia: α = 0.05

3. Estadística de prueba: F=CMtrat

CME ~ F( r−1, n−r )=F(3 ,16 )

4. Cálculos: De los datos se obtiene:

SCtrat=∑i=1

k

∑j=1

n i

( xij−x¿⋅¿ )2=∑

i=1

k X i ⋅¿2

k−

X¿⋅¿2

n¿¿¿

SCT=∑i=1

t

∑j=1

n i

( x ij−x¿⋅¿ )2 =∑

i=1

k

∑j=1

ni

x ij2−

X¿⋅¿2

n¿¿

SCE = SCT – Sctrat

Análisis de la Varianza----------------------------------------------------------------------------------------------------------Fuente Sumas de cuad. Gl Cuadrado Medio Cociente-F P-Valor----------------------------------------------------------------------------------------------------------Tratamientos 150.5 4 37.625 0.93 0.4749Error 609.5 15 40.6333----------------------------------------------------------------------------------------------------------Total 760.0 19

El F-ratio, que en este caso es igual a 0.925964, es el cociente de la estimación entre grupos y la estimación dentro de los grupos. Puesto que el p-valor del test F es superior o igual a 0.05, no hay diferencia estadísticamente significativa para un nivel 95.0%. Por lo que se concluye que

Page 24: Trabajo Final Anova-dca y Dbca Liliii

24

las 4 áreas si cumplieron con lo establecido.

Page 25: Trabajo Final Anova-dca y Dbca Liliii

25

Duncan--------------------------------------------------------------------------------Método: 95.0 porcentaje DuncanTratamientos Frec. Media Grupos homogéneos-------------------------------------------------------------------------------- 1 4 42.75 X 5 4 44.0 X 2 4 45.25 X 4 4 47.5 X 3 4 50.5 X--------------------------------------------------------------------------------Contraste Diferencias --------------------------------------------------------------------------------1 - 2 -2.5 1 - 3 -7.75 1 - 4 -4.75 1 - 5 -1.25 2 - 3 -5.25 2 - 4 -2.25 2 - 5 1.25 3 - 4 3.0 3 - 5 6.5 4 - 5 3.5 --------------------------------------------------------------------------------* indica una diferencia significativa.No hay diferencias estadísticamente significativas entre ningún par de medias a un nivel de confianza.95.0%. En la parte superior de la página, se identifica un grupo homogéneo según la alineación del signo X en la columna. Dentro de cada columna, los niveles que tienen signo X forman un grupo de medias entre las cuales no hay diferencias estadísticamente significativas.

Page 26: Trabajo Final Anova-dca y Dbca Liliii

26

DISEÑO DE BLOQUESCOMPLETAMENTE AL AZAR (DBCA)

El diseño en bloques más simple es el diseño en bloques completos. El diseño en bloques completos con una única observación por cada tratamiento se denomina diseño en bloques completamente aleatorizado o diseño en bloques completamente al azar.

Page 27: Trabajo Final Anova-dca y Dbca Liliii

27

DISEÑOS DE BLOQUES COMPLETOS AL AZAR (DBCA)

Este es el más simple y quizás el ampliamente usado de los diseños de bloques al azar. También es conocido como diseño de doble vía o aleatorizado.

El DBCA se usa cuando las unidades experimentales pueden agruparse en bloque relativamente homogéneos. El material experimental es dividido en b grupos de t unidades experimentales (UE) cada uno, donde t es el número de tratamientos, tales que las unidades experimentales dentro de cada grupo son lo más homogénea posible y las diferencias entre las unidades experimentales sea dada por estar en diferentes grupos. Los conjuntos son llamados bloques, dentro de cada bloque las unidades experimentales son asignadas aleatoriamente, cada tratamiento ocurre exactamente una vez en un bloque. Si la variación entre las unidades experimentales dentro de los bloques es apreciablemente pequeña en comparación con la variación entre bloques, un diseño de bloque completo al azar es más potente que un diseño completo al azar.La palabra completo en el nombre del diseño, se debe a que en cada bloque se prueban todos los tratamientos.

Se aleatorizan los tratamientos dentro de cada bloque. Debe considerarse que aleatorizaciòn se realizará de forma independiente para cada bloque.

Page 28: Trabajo Final Anova-dca y Dbca Liliii

28

Los factores de bloqueo que aparecen en la práctica son:

Page 29: Trabajo Final Anova-dca y Dbca Liliii

29

VENTAJAS DESVENTAJASEs fácil de analizar, extrae del error experimental la variación debida a los bloques además de la variación debida a tratamientos.

Menor número de grados de libertad para el error experimental. Si el número de tratamientos es muy elevado, se hace muy difícil conseguir un buen agrupamiento de las parcelas experimentales.

CARACTERISTICAS.

Las unidades homogéneas están agrupadas formando los bloques. En cada bloque se tiene un número de unidades igual al número de

tratamientos (bloques completos). Los tratamientos están distribuidos al azar en cada bloque. El número de repeticiones es igual al número de bloques.

Una situación experimental con k tratamientos y b bloques, considerando una repetición de tratamiento y bloques:

Para este diseño el modelo estadístico está dado por

Page 30: Trabajo Final Anova-dca y Dbca Liliii

30

Dónde: Uij: es la medición que corresponde al tratamiento i y al bloque j U : es la media global poblacional. t i: es el efecto debido al tratamiento i. Y j: es el efecto debido al bloque j. E i j : es el error aleatorio atribuible a la medición

Se supone que los errores se distribuyen de manera normal con media cero y varianza constante y que son independientes entre sí.

HIPOTESIS A PROBAR

Como ya se ha mencionado, la hipótesis de interés es la misma para todos los diseños comparativos, y está dado por

Que también se puede expresar como

En cualquiera de estas hipótesis la afirmación a probar es que la respuesta media poblacional lograda con cada tratamiento es la misma para los k tratamientos, y que por tanto cada respuesta media U1 es igual a la media global poblacional U. De manera alternativa,

ANALISIS DE VARIANZA

Las hipótesis dadas anteriormente se prueba con un análisis de varianza con dos se controlan dos fuentes de variación: el factor tratamiento y el factor de bloque.

Page 31: Trabajo Final Anova-dca y Dbca Liliii

31

Los cálculos necesarios pueden ser manuales Las fórmulas más prácticas para calcular la suma de cuadrados, son:

Y la del error se obtiene por sustracción como:

SCE=SCT-SCTRAT - SCB

CASO PRÁCTICO:

TIPO DE CUERO

OBSERVACIONES

A 264 260 258 241 262 255

B 208 220 216 200 213 206

C 220 263 219 225 230 228

D 217 226 215 224 220 222

Analizar. ** Tipos de cuero:A = Cuero Natural

Page 32: Trabajo Final Anova-dca y Dbca Liliii

32

B = Cuero ApomazadoC = Cuero Pintado.D = Cuero con protecciónPaso 1: Reconocer las hipótesis:

Ho: µa = µB = µC = µDHa: µA ╪ µB ╪ µC ╪ µd

Paso 2: Nivel de significancia:

α= 0.05 ó α = 0.01

Paso 3: Se usa la función Fe

Paso 4: ANOVA.

SCT = 1275024 – (5512)²/24SCT = 9101,333

SCTRAT = (1/6)x 7637970 –(5512)²/24SCTRAT = 7072,333.

Page 33: Trabajo Final Anova-dca y Dbca Liliii

33

SCE=SCT-SCTRAT - SCB

SCE = 9101,333 - 7070,333 - 915,333SCE = 1113,667

CONCLUSION:

Fe = 31.75 > 3.29

Se rechaza la hipótesis nula Ho, aceptando que existe diferencia significativa entre los 4 tipos de cuero.

Análisis estadístico: Análisis de la varianza de dos vías.

Las hipótesis de que los distintos tratamientos y los bloques no producen ningún efecto

se contrasta mediante el análisis de la varianza de dos vías, comparando la variabilidad

entre bloques y la variabilidad entre tratamientos con la variabilidad dentro de los

grupos.

Los resultados fundamentales se resumen en la tabla siguiente.

Fuente devariación

Suma decuadrado

s

Grados de

libertad

CuadradosMedios

Valor deF calculado

Page 34: Trabajo Final Anova-dca y Dbca Liliii

34

Tratamientos

Entre Bloques

Error

SCTrat

SCBloq

SCE

k-1

r – 1

(k-1)(r-1)

CMTrat = SCTrat / (k - 1)

CMBloq = SCBloq / (r - 1)

CME = SCE /(k -1)(r -1)

FC=CMTratCME

FF=CMBloqCME

Total SCT rk - 1

Donde:

SCT=∑i=1

k

∑j=1

r

( yij− y¿⋅¿)2

=∑i=1

k

∑j=1

r

yij2−

Y¿⋅¿2

rk¿¿

SCTrat=∑i=1

k

∑j=1

r

( y i⋅¿− y¿⋅¿)

2=1

r∑i=1

k

Yi⋅¿2−

Y¿⋅¿2

rk¿¿¿¿

SCTrat=∑i=1

k

∑j=1

r

( y¿ j− y¿⋅¿ )

2=1k∑j=1

r

Y ¿ j2 −

Y¿⋅¿2

rk¿¿

SCE = SCT – SCTrat - SCBloq

Regla de decisión.

Efectos de los tratamientos

Rechazar H0C

si el valor de F C > F [α , k −1, (k − 1)( r − 1)] .

No rechazar H0C

si el valor de F C ≤ F [α , k −1, (k − 1)( r − 1)] .

Efectos de los bloques

Rechazar H0F

si el valor de F F > F [α , r −1, (k − 1)( r − 1)] .

No rechazar H0F

si el valor de F F ≤ F [α , r −1, (k − 1)( r − 1)] .

Los estimadores de los efectos de los bloques y tratamientos se

estiman a partir de

CV=√CMEY

×100

Page 35: Trabajo Final Anova-dca y Dbca Liliii

35

y la parte propia de cada observación (o residual)

Los residuales pueden servirnos para la validación de las hipótesis básicas de la misma

manera que en el diseño de una vía.

El modelo matemático es ahora

Donde es el efecto debido al bloque, es el efecto debido al tratamiento y

es el error experimental.

Obsérvese que solamente hemos sustraído del residual la parte correspondiente a los

bloques.

EJERCICIOS RESUELTOS DEL DBCA

1. Un administrador desea estudiar la eficiencia (por minuto) de 6 programas diferentes que se utilizan en su empresa para realizar diferentes análisis, para así decidir con cual de ellas trabajar. Asigna a 4 trabajadores un análisis para trabajarlos en cada uno de los programas y así medir las eficiencias de estos. A continuación se presentan los resultados del experimento.

Tipo de programa

TrabajadoresA B C D

I 30.4 28.8 33.0 31.8

Page 36: Trabajo Final Anova-dca y Dbca Liliii

36

II 33.9 25.5 23.7 33.5III 32.5 27.3 34.5 34.5IV 34.9 29.3 36.0 33.8V 31.9 27.5 36.5 34.5VI 35.4 28.3 34.2 36.0

a) Con un nivel de significación de α=0.05 ¿Los programas son igual de eficientes?

SOLUCIÓN:

Tipo de programa

Trabajadores

A B C D x¿ j x¿ jI 30.4 28.8 33 31.8 124 31.00II 33.9 25.5 23.7 33.5 116.6 29.15III 32.5 27.3 34.5 34.5 128.8 32.20IV 34.9 29.3 36 33.8 134 33.50V 31.9 27.5 36.5 34.5 130.4 32.60VI 35.4 28.3 34.2 36 133.9 33.48

x i⋅¿ ¿ 199 166.7 197.9 204.1 767.7

x i⋅¿ ¿ 56.86 47.63 56.54 58.31 54.84

Hipótesis Estadística:

H 0 : ¿1=¿2=¿3=¿4=¿5=¿6 = 0

H 1 : ; Los ¿i .' s no todos son iguales

H 0=β 1=β 2=β3=β 4=0

H 1 : ; Los β j

s no todos son igualesNivel de Significancia

¿= 0.05

Estadística de PruebaF TRAT = CMR TRAT CMEF BLOQ = CM BLOQ

CMEF TRAT = F (k-1, b-1,¿ )

Cálculos:

SCT = ∑i=1

3

∑j=1

6

y ij

2

-

y . .2

bk

SCT = 34.42+28.82+…+312-

767 . 72

24SCT = 222.01Ahora:

SC TRAT = ∑i=1

3 y i .

2

b -

y ..

2

bk

Page 37: Trabajo Final Anova-dca y Dbca Liliii

37

SC TRAT =

(124 )2+ (116.6 )2+. . .+ (133 . 9 )2

4−767 .72

24SC TRAT = 173.425

Hallamos:

SCT BLOQ = ∑j=1

6 y . j

k− T . .

bk

SCT BLOQ =

(199 )2+(166 .7 )2+ (197 . 9 )2+(204 . 1 )2

6−767 . 72

24

SCT BLOQ = 21.5321

Entonces:SCE = SCT- SC TRAT - SCT BLOQ.

21.5321=222.01-173.425.

ANÁLISIS DE LA VARIANZA

Dado que un p-valor es inferior a 0.05, este factor tiene efecto estadísticamente significativo en Repeticiones para un 95.0%. Es decir que existe diferencia entre los cuatro programas.

DUNCAN

--------------------------------------------------------------------------------------------------------Método: 95.0 porcentaje DuncanBloques Recuento Media LS Sigma LS Grupos Homogéneos-------------------------------------------------------------------------------------------------------- 1 4 31.0 0.671477 X 2 4 31.4 0.671477 XX 3 4 32.25 0.671477 XX 5 4 32.6 0.671477 XX 6 4 33.475 0.671477 X 4 4 33.5 0.671477 X--------------------------------------------------------------------------------------------------------Contraste Diferencias--------------------------------------------------------------------------------------------------------1 - 2 -0.4 1 - 3 -1.25 1 - 4 *-2.5 1 - 5 -1.6

FuenteSuma de

cuadradosGL

Cuadrado Medio

Cociente-F P-Valor

Bloques 21.5321 5 4.30642 2.39 0.0878Tratamientos

173.425 3 57.8082 32.05* 0.0000

Error 27.0529 15 1.80353

TOTAL 222.01 23

Page 38: Trabajo Final Anova-dca y Dbca Liliii

38

1 - 6 *-2.475 2 - 3 -0.85 2 - 4 -2.1 2 - 5 -1.2 2 - 6 -2.075 3 - 4 -1.25 3 - 5 -0.35 3 - 6 -1.225 4 - 5 0.9 4 - 6 0.025 5 - 6 -0.875 --------------------------------------------------------------------------------------------------------* indica una diferencia significativa.Se identifican 2 grupos homogéneos según la alineación del signo X en la columna. Dentro de cada columna, los niveles que tienen signo X forman un grupo de medias entre las cuales no hay diferencias estadísticamente significativas. Pero si existiendo diferencia entre 1y6 , 1y 4.

2. Un administrador de una empresa de fotográfica tiene que realizar una compra de impresoras de gran calidad que se van a utilizar en imprimir fotografías digitales. El administrador averiguo sobre 5 marcas de impresoras de similares características y precios. El sabe que para su empresa es un importante la “velocidad de impresión” y por este, motivo, esta interesado en saber si las impresoras ofertadas tienen la misma velocidad. Para responder a esta pregunta decide hacer un experimento que consiste en elegir única muestra de J = 4 fotos e imprimirlas en las 5 impresoras. Los resultados del experimento de recogen en la tabla adjunta:

ImpresorasFotos

A B C DI 89 88 97 94II 84 77 92 79III 81 87 87 85IV 87 92 89 84VI 79 81 80 88

SOLUCIÓN:

ImpresorasFotos

A B C D x¿ j x¿ jI 89 88 97 94 368 92.00II 84 77 92 79 332 83.00III 81 87 87 85 340 85.00IV 87 92 89 84 352 88.00V 79 81 80 88 328 82.00

x i⋅¿ ¿ 420 425 445 430 1720

x i⋅¿ ¿ 140.00 141.67 148.33 143.33 143.33

Hipótesis Estadística:

H 0 : ¿1=¿2=¿3=¿4=¿5 = 0H 1 : ; Los ¿i .

' s no todos son iguales

Page 39: Trabajo Final Anova-dca y Dbca Liliii

39

H 0=β 1=β 2=β3=β 4=0H 1 : ; Los β j

s no todos son iguales

SCT = ∑i=1

3

∑j=1

6

y ij

2

-

y . .2

bk

SC TRAT = ∑i=1

3 y i .

2

b -

y ..

2

bk

SCT BLOQ = ∑j=1

6 y . j

k− T . .

bk

SCE = SCT- SC TRAT - SCT BLOQ.

ANÁLISIS DE LA VARIANZA-------------------------------------------------------------------------------------------------------------------

Fuente Suma de cuadrados GL Cuadrado Medio Cociente-F P-Valor-------------------------------------------------------------------------------------------------------------------

-Bloques 264.0 4 66.0 3.50 * 0.0407Tratamientos 70.0 3 23.3333 1.24 * 0.3387

Error 226.0 12 18.8333-------------------------------------------------------------------------------------------------------------------

-TOTAL 560.0 19--------------------------------------------------------------------------------------------------------------------

TUKEY----------------------------------------------------------------------------------------------------Método: 95.0 porcentaje HSD de TukeyBloques Recuento Media LS Sigma LS Grupos Homogéneos----------------------------------------------------------------------------------------------------- 5 4 82.0 2.16987 X 2 4 83.0 2.16987 XX 3 4 85.0 2.16987 XX 4 4 88.0 2.16987 XX 1 4 92.0 2.16987 X-----------------------------------------------------------------------------------------------------Contraste Diferencias +/- Límites-----------------------------------------------------------------------------------------------------

1 - 2 9.0 9.797481 - 3 7.0 9.797481 - 4 4.0 9.797481 - 5 *10.0 9.797482 - 3 -2.0 9.797482 - 4 -5.0 9.797482 - 5 1.0 9.797483 - 4 -3.0 9.797483 - 5 3.0 9.797484 - 5 6.0 9.79748

Page 40: Trabajo Final Anova-dca y Dbca Liliii

40

---------------------------------------------------------------------------------------------------------* indica una diferencia significativa.

Se identifican 2 grupos homogéneos según la alineación del signo X en la columna. Dentro de cada columna, los niveles que tienen signo X forman un grupo de medias entre las cuales no hay diferencias estadísticamente significativas.

DUNCAN---------------------------------------------------------------------------------------------------Método: 95.0 porcentaje DuncanBloques Recuento Media LS Sigma LS Grupos Homogéneos---------------------------------------------------------------------------------------------------- 5 4 82.0 2.16987 X 2 4 83.0 2.16987 X 3 4 85.0 2.16987 XX 4 4 88.0 2.16987 XX 1 4 92.0 2.16987 X---------------------------------------------------------------------------------------------------Contraste Diferencias--------------------------------------------------------------------------------------------------- 1 - 2 *9.0 1 - 3 7.0 1 - 4 4.0 1 - 5 *10.0 2 - 3 -2.0 2 - 4 -5.0 2 - 5 1.0 3 - 4 -3.0 3 - 5 3.0 4 - 5 6.0 ----------------------------------------------------------------------------------------------------* indica una diferencia significativa.

Se identifican 2 grupos homogéneos según la alineación del signo X en la columna. Dentro de cada columna, los niveles que tienen signo X forman un grupo de medias entre las cuales no hay diferencias estadísticamente significativas. El método actualmente utilizado para

Page 41: Trabajo Final Anova-dca y Dbca Liliii

41

3. A los administradores de una empresa de diseños de modas se les ha asignado la tarea de averiguar las cantidades de trajes que realizan en una semana, así obtuvieron el siguiente registro:

BloquesTratamientos

A B C D E FI 455 72 61 215 695 501II 622 82 444 170 437 134III 695 56 50 443 701 373IV 607 650 493 257 490 262V 388 263 185 103 518 62200

Si en la empresa hay 5 áreas que realizan la misma función, en cada una de ellas existe 6 maquinas industriales que ayudan en su labor. Ayudar al administrador a determinar si las diferentes áreas de la empresa son igual de eficientes o no.Determine con un nivel de significancia de 0.05

SOLUCIÓN:

BloquesTratamientos

A B C D E F x¿ j x¿ j

I 455.00 72.00 61.00 215.00 695.00 501.00 1999 333.17

II 622.00 82.00 444.00 170.00 437.00 134.00 1889 314.83

III 695.00 56.00 50.00 443.00 701.00 373.00 2318 386.33

IV 607.00 650.00 493.00 257.00 490.00 262.00 2759 459.83

VI 388.00 263.00 185.00 103.00 518.00 622.00 2079 346.50x i⋅¿ ¿ 2767 1123 1233 1188 2841 1892 11044x i⋅¿ ¿ 922.33 374.33 411.00 396.00 947.00 630.67 613.56

Hipótesis Estadística:

H 0 : ¿1=¿2=¿3=¿4=¿5 = 0

H 1 : ; Los ¿i .' s no todos son iguales

H 0=β 1=β 2=β3=β 4=β 5=β6 0

H 1 : ; Los β j

s no todos son iguales

Cálculos:

SCT = ∑i=1

3

∑j=1

6

y ij

2

-

y . .2

bk

SC TRAT = ∑i=1

3 y i .

2

b -

y ..

2

bk

Page 42: Trabajo Final Anova-dca y Dbca Liliii

42

SCT BLOQ = ∑j=1

6 y . j

k− T . .

bk

SCE = SCT- SC TRAT - SCT BLOQ.

ANÁLISIS DE LA VARIANZA

----------------------------------------------------------------------------------------------------------------Fuente Suma de cuadrados GL Cuadrado Medio Cociente-F P-Valor

---------------------------------------------------------------------------------------------------------------- Bloques       79630    4 19908   0.58   0.682 Tratamiento     634335   5 126867   3.68   0.016 Error           689107    20 34455 ---------------------------------------------------------------------------------------------------------------- TOTAL            1403071 29

Si existen diferencias significativas entre las medias de los bloques.  De acuerdo con el valor P = 0.016 y dado nuestro valor de significancia de 0.05 tenemos que la hipótesis se rechaza y por lo tanto existen diferencias significativas entre las 5 áreas.

DUNCAN

-----------------------------------------------------------------------------------------Método: 95.0 porcentaje DuncanBloques Recuento Media LS Sigma LS ----------------------------------------------------------------------------------------- 2 5 224.6 83.0124 4 5 237.6 83.0124 3 5 246.6 83.0124 6 5 378.4 83.0124 1 5 553.4 83.0124 5 5 568.2 83.0124 -----------------------------------------------------------------------------------------Contraste Diferencias-----------------------------------------------------------------------------------------1 - 2 *328.8 1 - 3 *306.8 1 - 4 *315.8 1 - 5 -14.8 1 - 6 175.0 2 - 3 -22.0 2 - 4 -13.0 2 - 5 *-343.6 2 - 6 -153.8 3 - 4 9.0 3 - 5 *-321.6 3 - 6 -131.8 4 - 5 *-330.6 4 - 6 -140.8 5 - 6 189.8 ----------------------------------------------------------------------------------------* indica una diferencia significativa.

Page 43: Trabajo Final Anova-dca y Dbca Liliii

43

En la parte superior de la página, se identifican 2 grupos homogéneos según la alineación del signo X en la columna. Dentro de cada columna, los niveles que tienen signo X forman un grupo de medias entre las cuales no hay diferencias estadísticamente significativas. Existe diferencia significativa entre

4.- Se consideran cuatro diferentes máquinas M1, M2, M3 y M4 para el ensamblaje de un producto particular. Se decide que utilizar 4 operadores diferentes en un experimento de bloques aleatorizados para comparar las máquinas. Las máquinas se asignan en orden aleatorio a cada operador. La operación de las máquinas requiere destreza física y se anticipa que habrá una diferencia entre los operadores en la rapidez con la que operan las máquinas. Se registra la cantidad de tiempo en segundos para ensamblar el producto. Averiguar si ambas maquinas son igual de eficientes. 

BLOCKSOperadores

A B C DI 6 2 8 3II 7 5 5 7III 10 4 9 5IV 9 5 6 5

SOLUCIÓN:

BLOCKSOperadores

A B C D x¿ j x¿ jI 6 2 8 3 19 4.75II 7 5 5 7 24 6.00III 10 4 9 5 28 7.00IV 9 5 6 5 25 6.25

x i⋅¿ ¿ 32 16 28 20 96x i⋅¿ ¿ 12.80 6.40 11.20 8.00 9.60

Hipótesis Estadística:

H 0 : ¿1=¿2=¿3=¿4 = 0

H 1 : ; Los ¿i .' s no todos son iguales

H 0=β 1=β 2=β3=β 4=0

H 1 : ; Los β j

s no todos son igualesCálculos:

SCT = ∑i=1

3

∑j=1

6

y ij

2

-

y . .2

bk

SC TRAT = ∑i=1

3 y i .

2

b -

y ..

2

bk

SCT BLOQ = ∑j=1

6 y . j

k− T . .

bk

SCE = SCT- SC TRAT - SCT BLOQ.

Page 44: Trabajo Final Anova-dca y Dbca Liliii

44

ANÁLISIS DE LA VARIANZA

----------------------------------------------------------------------------------------------------------Fuente Suma de cuadrados GL Cuadrado Medio Cociente-F P-Valor-----------------------------------------------------------------------------------------------------------Bloques 10.5 3 3.5 1.34 0.3214Tratamientos 40.0 3 13.3333 5.11 0.0246 Error 23.5 9 2.61111----------------------------------------------------------------------------------------------------------TOTAL 74.0 15----------------------------------------------------------------------------------------------------------De acuerdo con el valor P = 0.0246 y dado nuestro valor de significancia de 0.05 tenemos que la hipótesis se rechaza y por lo tanto existen diferencias significativas en la eficiencia de las maquinas.

DUNCAN---------------------------------------------------------------------------------------Método: 95.0 porcentaje DuncanBloques Recuento Media LS Sigma LS Grupos Homogéneos-------------------------------------------------------------------------------- 1 4 4.75 0.807947 X 2 4 6.0 0.807947 X 4 4 6.25 0.807947 X 3 4 7.0 0.807947 X--------------------------------------------------------------------------------Contraste Diferencias--------------------------------------------------------------------------------1 - 2 -1.25 1 - 3 * -2.25 1 - 4 -1.5 2 - 3 -1.0 2 - 4 -0.25 3 - 4 0.75 --------------------------------------------------------------------------------* indica una diferencia significativa.

En la parte superior de la página, se identifica un grupo homogéneo según la alineación del signo X en la columna. Dentro de cada columna, los niveles que tienen signo X forman un grupo de medias entre las cuales no hay diferencias estadísticamente significativas.

5.- La siguiente tabla representa el numero de motos lineales que de vendió en el día. Representar en un análisis de varianza las ventas del día.

VendedoresMarca de motos

A B C D

I 6 2 8 3

II 7 5 5 7

III 10 4 9 5

IV 9 5 6 5

Page 45: Trabajo Final Anova-dca y Dbca Liliii

45

SOLUCIÓN:

VendedoresMarca de Motos

A B C D x¿ j x¿ jI 6 2 8 3 19 4.75II 7 5 5 7 24 6.00III 10 4 9 5 28 7.00IV 9 5 6 5 25 6.25

x i⋅¿ ¿ 32 16 28 20 96

x i⋅¿ ¿ 12.80 6.40 11.20 8.00 9.60

Hipótesis Estadística: ¿1=¿2=¿3=¿4 = 0

H 1 : ; Los ¿i .' s no todos son iguales

H 0=β 1=β 2=β3=β 4=0

H 1 : ; Los β j

s no todos son iguales

Cálculos:

SCT = ∑i=1

3

∑j=1

6

y ij

2

-

y . .2

bk

SC TRAT = ∑i=1

3 y i .

2

b -

y ..

2

bk

SCT BLOQ = ∑j=1

6 y . j

k− T . .

bk

SCE = SCT- SC TRAT - SCT BLOQ.

ANÁLISIS DE LA VARIANZA-------------------------------------------------------------------------------------------------------------Fuente Suma de cuadrados GL Cuadrado Medio Cociente-F P-Valor--------------------------------------------------------------------------------------------------------------Bloques 10.5 3 3.5 1.34 0.3214 Tratamientos 40.0 3 13.3333 5.11 0.0246Error 23.5 9 2.61111-------------------------------------------------------------------------------------------------------------TOTAL 74.0 15-------------------------------------------------------------------------------------------------------------

Page 46: Trabajo Final Anova-dca y Dbca Liliii

46

Dado que un p-valor es inferior a 0.05, este factor tiene efecto estadísticamente significativo en Repeticiones para un 95.0%. exite diferencia en la eficie de los vendedores para ventas de motos

DUNCAN-----------------------------------------------------------------------------------------------------Método: 95.0 porcentaje DuncanBloques Recuento Media LS Sigma LS Grupos Homogéneos----------------------------------------------------------------------------------------------------- 1 4 4.75 0.807947 X 2 4 6.0 0.807947 X 4 4 6.25 0.807947 X 3 4 7.0 0.807947 X-----------------------------------------------------------------------------------------------------Contraste Diferencias-----------------------------------------------------------------------------------------------------1 - 2 -1.25 1 - 3 -2.25 1 - 4 -1.5 2 - 3 -1.0 2 - 4 -0.25 3 - 4 0.75 --------------------------------------------------------------------------------* indica una diferencia significativa.

En la parte superior de la página, se identifica un grupo homogéneo según la alineación del signo X en la columna. Dentro de cada columna, los niveles que tienen signo X forman un grupo de medias entre las cuales no hay diferencias estadísticamente significativas.

Page 47: Trabajo Final Anova-dca y Dbca Liliii

47

H 0 :