estadistica industrial

52
Distribución F Esta distribución probabilística se utiliza como estadístico de prueba en varias situaciones. Sirve para demostrar si dos varianzas muestrales provienen de la misma población o de poblaciones iguales, y también se aplica cuando se desean comparar simultáneamente tres o más medias poblacionales. Esta comparación simultánea de varias medias poblacionales se denomina Análisis de varianza (de análisis of variance). En estos dos casos, las poblaciones deben ser normales y los datos deben estar al menos medidos en escala de intervalo.

description

estadistica industrial unmsm

Transcript of estadistica industrial

  • Distribucin F

    Esta distribucin probabilstica se utiliza como

    estadstico de prueba en varias situaciones. Sirve para

    demostrar si dos varianzas muestrales provienen de la

    misma poblacin o de poblaciones iguales, y tambin se

    aplica cuando se desean comparar simultneamente tres o

    ms medias poblacionales. Esta comparacin simultnea de

    varias medias poblacionales se denomina Anlisis de

    varianza (de anlisis of variance). En estos dos casos, las

    poblaciones deben ser normales y los datos deben estar al

    menos medidos en escala de intervalo.

  • Caractersticas de la distribucin F

    1. Existe una familia de distribuciones F. Un elemento especfico de la familia est determinado por dos parmetros: los grados de libertad en el numerador y

    los grados de libertad en el denominador.

    2. El valor de F no puede ser negativo. 3. La distribucin F es una distribucin continua. 4. La curva que representa una distribucin F tiene un sesgo positivo. 5. Sus valores varan de 0 a . A medida que aumenta el valor de F, la curva se

    aproxima al eje X, pero nunca lo toca.

  • Comparacin de dos varianzas poblacionales

    La distribucin F se utiliza para demostrar la hiptesis de que la

    varianza de una poblacin normal es igual a la varianza de otra

    poblacional normal. As, la prueba es til para determinar si una

    poblacin normal tiene o no ms variacin que otra. En los siguientes

    ejemplo se muestra el uso de esta prueba:

    Dos cizallas se ajustan para producir elementos de acero de la misma

    longitud. Por tanto, los elementos tener la misma longitud. Se desea

    estar seguro que adems de tener la misma longitud, tengan una

    variacin similar.

    La tasa media de rendimiento a la inversin de dos tipos de acciones

    puede ser la mismo, pero hay ms variacin en el rendimiento de una

    que de otra. Una muestra de 10 acciones de industria aeroespacial y 10

    acciones de servicios podran mostrar la misma tasa media de

    rendimiento, pero es probable que haya ms variacin en el rendimiento

    de las acciones aeroespaciales.

  • Consideraciones de validacin

    Al comparar las varianzas de dos poblaciones usaremos datos

    reunidos de dos muestras aleatorias independientes, una de la

    poblacin 1 y la otra de la poblacin 2. Las dos varianzas de las

    muestras, 21s y 2

    2s sern la base para hacer inferencias acerca de las

    dos varianzas poblacionales 21 y 2

    2 . Siempre que las dos varianzas

    poblacionales sean iguales ( 21 =2

    2 ), la distribucin de la relacin de

    las dos varianzas de las muestras 21s /2

    2s es la siguiente:

  • Distribucin muestral de 21s / 22s cuando 21 = 22

    Siempre que se seleccionan muestras aleatorias simples de

    tamao n1 y n2 a partir de poblaciones normales con

    varianzas iguales, la distribucin de las muestras

    2

    2

    2

    1

    s

    s (9)

    tiene distribucin F con n1 1 grados de libertad para el

    numerador y n2 1 grados de libertad para el denominador; 2

    1s es la varianza de la muestra de los n1 artculos

    procedentes de la poblacin 1 y 22s es la de los n2 artculos

    procedentes de la poblacin 2.

  • EJEMPLO

    La Escuela bancaria va a renovar su contrato de servicio de

    autobs escolar para el ao prximo, y debe seleccionar entre

    las empresas Transportes rpidos, S.A. y Transportes eficaces,

    S.A.. Usaremos la varianza de los tiempos de recepciones que

    se tarda en recoger y entregar alumnos como medida principal

    de la calidad del servicio. Los valores bajos de varianza indican

    que el servicio es ms consistente y de mayor calidad. Si las

    varianzas de los tiempos de llegada asociadas con los dos

    servicios son iguales, los administradores de la Escuela

    bancaria seleccionarn la empresa que ofrezca mejores

    condiciones financieras. Sin embargo, si los datos de las

    muestras de tiempos de llegada para las dos empresas indican

    que hay una gran diferencia entre las varianzas, los

    administradores tendrn muy en cuenta a la que tenga menor

    varianza del servicio

  • Las hiptesis de prueba son las siguientes:

    2

    2

    2

    11

    2

    2

    2

    10

    :

    :

    H

    H

    Si se puede rechazar 0H , es adecuada la conclusin

    de distinta calidad en los servicios. En tal caso, se

    preferir a la empresa con menor varianza de la

    muestra.

  • Suponga que se har la prueba de hiptesis con =

    0.10 y que se obtienen muestras de tiempos de

    llegada con escuelas que actualmente usan los

    servicios de los dos transportistas. Se obtiene una

    muestra de 25 tiempos para los rpidos (poblacin

    1) y una de 16 para los eficaces (poblacin 2). La

    figura 3 es la grfica de la distribucin F con n1

    1 = 24 grados de libertad en el numerador y n2 1

    = 15 grados de libertad en el denominador.

  • Observe que la regin bilateral de rechazo se caracteriza por los valores crticos en 95.0F y 05.0F .

    Fig. 3: Regin de rechazo para el ejemplo del autobs para la escuela bancaria con = 0.05

    2

    2

    2

    1

    s

    sF

    0.05 0.05

    F0.95 F0.05 Se rechaza H0 Se rechaza H0

  • Suponga que las dos muestras de tiempos de

    llegada del autobs produjeron las varianzas 21s =

    48 para los rpidos y 22s = 20 para los eficaces.

    Qu conclusin es la adecuada? Se supone que

    las dos poblaciones de tiempos de llegada tienen

    distribuciones normales de probabilidad, y que 0H

    es verdadera si 21 = 22 . Se puede aplicar la

    distribucin F para llegar a una conclusin.

    Especficamente, se calcula 2221 / ssF y se emplea la

    regin de rechazo que vemos en la figura 3.

  • De este modo, llegamos a:

    40.220

    482

    2

    2

    1 s

    sF

    Consultando la tabla, vemos que el valor crtico

    unilateral superior (de la cola superior) con 24

    grados de libertad en el numerador y 15 en el

    denominador es 29.205.0 F . Aunque la tabla no

    indica valores 95.0F observamos que no es necesaria

    la determinacin de este valor crtico unilateral

    inferior. Se puede observar que F = 2.40 es mayor

    que 29.205.0 F . Entonces, con un nivel de

    significancia de 0.10 se rechaza H0.

  • Este resultado conduce a la conclusin de que los

    dos servicios de autobs son distintos en lo

    concerniente a varianzas de tiempos de recepcin

    y de llegada. Nuestra recomendacin es que los

    administradores de la Escuela bancaria den

    consideracin especial al mejor servicio, con

    menor varianza, que ofrecen los Transportes

    eficaces, S.A.

    Tambin se puede usar el criterio del valor p

    para una prueba de hiptesis acerca de dos

    varianzas poblacionales. Se aplica la regla de

    rechazo comn: rechazar H0 si el valor p < . Sin

    embargo, al igual que con la distribucin ji

    cuadrada, es difcil determinar el valor p

    directamente de las tablas de la distribucin F.

  • Prueba bilateral de la varianza de dos

    poblaciones

    2

    2

    2

    11

    2

    2

    2

    10

    :

    :

    H

    H

    Se denota la poblacin que tiene la mayor

    varianza de la muestra como poblacin 1.

    Estadstico de prueba

    2

    2

    2

    1

    s

    sF

    Regla de rechazo

    Con el estadstico de prueba: Rechazar 0H si

    2/FF

    Con el valor p : Rechazar 0H si el

    valor p< Donde el valor 2/F se basa en una distribucin F

    con n1 1 grados de libertad en el numerador y n2 1 grados de libertad en el denominador.

  • Prueba unilateral sobre las varianzas de dos poblaciones

    2

    2

    2

    11

    2

    2

    2

    10

    :

    :

    H

    H

    Se denota la poblacin que tiene la mayor varianza de la muestra como

    poblacin 1.

    Estadstico de prueba

    2

    2

    2

    1

    s

    sF

    Regla de rechazo

    Con el estadstico de prueba: Rechazar 0H si FF

    Con el valor p : Rechazar 0H si el valor p<

    Donde el valor F se basa en una distribucin F con n1 1 grados de

    libertad en el numerador y n2 1 grados de libertad en el denominador.

  • Anova Nocin general

    El segundo uso de la distribucin F comprende la tcnica

    del anlisis de varianza, que se simboliza por ANOVA.

    Bsicamente, en ese anlisis se emplea informacin muestral

    para determinar si tres o ms tratamientos producen o no

    resultados diferentes. El uso de la palabra tratamiento tiene su

    origen en la investigacin agrcola. Se trataron campos con

    distintos fertilizantes o fumigantes, para determinar si haba o no

    una diferencia global en la productividad. Se probar si cinco

    aditivos para la gasolina (los tratamientos) dan o no como

    resultado una diferencia en el rendimiento en millas por galn.

    Adems se explotar la siguiente pregunta: Los cuatros mtodos

    de entrenamiento (los tratamientos) son igualmente efectivos?

  • Tratamiento: Causa o fuente especfica de

    variacin en un conjunto de datos.

  • Consideraciones en que se basa la prueba

    ANOVA

    Antes de realizar una prueba utilizando la tcnica ANOVA se

    examinarn las consideraciones en que se basa la prueba. Si no

    pueden cumplirse las consideraciones siguientes, es posible

    aplicar otra tcnica de anlisis de varianza (que desarrollaron

    Kruskal y Wallis).

    1.Las tres o ms poblaciones de inters estn distribuidas

    normalmente.

    2.Tales poblaciones tienen desviaciones estndar iguales.

    3.Las muestras que se seleccionan de cada una de las

    poblaciones son aleatorias e independientes, es decir, no estn

    relacionadas entre s.

  • Ejemplo

    Suponga que renunci el gerente de la sucursal de

    Los Olivos de la cadena de tiendas comerciales Metro, y

    se considera que tres vendedores pueden ocupar este

    puesto. Los tres tienen la misma antigedad, educacin,

    etc. Para tomar una decisin, el gerente de personal, sugiri

    examinar los registros de ventas mensuales de cada uno.

  • En la siguiente tabla se muestran los resultados maestrales de las ventas por mes:

    Ventas mensuales ($ 000)

    Sr. Quiroz Sr. Huarote Sr. Martnez

    15 15 19

    10 10 12

    9 12 16

    5 11 16

    16 12 17

    Media muestral: 11 12 16

    En este problema los vendedores son los tratamientos.

  • 3210 : H La hiptesis nula expresa que no

    hay diferencia significativa entre las ventas

    medias de los tres vendedores.

    :1H Plantea que al menos una media es diferente.

    Se seleccion un nivel de significancia =

    0.05.

    El estadstico de prueba adecuado es la

    distribucin F. Este procedimiento se basa en

    varias consideraciones: 1) Los datos deben estar al

    menos en nivel de intervalo; 2) La seleccin real

    de las ventas debe hacerse utilizando un

    procedimiento de tipo probabilstico; 3) La

    distribucin de las venta mensuales para cada una

    de las poblaciones es normal y 4) Las varianzas de

    las tres poblaciones son iguales, es decir, 2

    3

    2

    2

    2

    1 .

  • F es la razn de dos varianzas:

    muestraslaseniacinlasegnestimadalpoblacionaVarianza

    muestralesmediasentreiacinsegnestimadalpoblacionaVarianzaF

    var

    var

    La terminologa comn para el numerador es

    varianza entre muestras. Para el denominador

    es varianza en las muestras. El numerador

    tiene 1k grados de libertad. El denominador tiene

    kN grados de libertad; donde k es el nmero de

    tratamientos y N es el nmero de observaciones.

  • Para este problema relativo a un nuevo gerente de

    almacn, hay tres tratamientos (vendedores), por lo que

    se tiene k 1 = 3 1 = 2 g.l. en el numerado. Hay 15

    observaciones (tres muestras de cinco cada una), por

    tanto, hay N k = 15 3 = 12 g.l. en el denominador.

    El valor crtico, esto es, el punto divisorio entre la regin de

    aceptacin y la de rechazo, se obtiene consultando la

    tabla correspondiente. Ese nmero es 3.89, y es el valor

    crtico de F para el nivel 0.05.

  • Al utilizar el nivel predeterminado de 0.05, la regla de

    decisin es aceptar la hiptesis nula si el valor calculado de

    F es menor que o igual a 3.89; se rechaza la hiptesis nula

    y se acepta la alternativa, si el valor calculado de F es

    mayor que 3.89.

    Para calcular F y tomar una decisin, el primer paso

    es organizar una tabla ANOVA. Esta es slo una forma

    conveniente de registrar la suma de cuadrados y otros

    clculos. El formato general para un problema de anlisis

    de varianza en un sentido se muestra en la siguiente tabla:

  • Fuente de Suma de Grados

    de Cuadrados variacin cuadrados libertad medios

    Entre tratamientos SST k - 1

    SST/k-1= MSTR

    Error (en los tratamientos) SSE N - k

    SSE/N-k = MSE

    Total Total SS

    MSE

    MSTR

    kN

    SSEk

    SST

    F

    1

    en donde:

    MSTR: cuadrado medio entre tratamientos.

    MSE : cuadrado medio debido al error. Tambin se denomina cuadrado

    medio dentro de tratamiento.

    SST : suma de cuadrados de tratamiento.

  • Se obtiene mediante la siguiente frmula:

    N

    X

    n

    TSST

    c

    c

    22 )(

    en donde:

    2

    cT : indica elevar al cuadrado el total de cada columna

    (el subndice c se refiere a la columna)

    cn : es el nmero de observaciones para cada

    tratamiento respectivo (columna). Hay cinco cifras de

    ventas para el Sr. Quiroz, cinco para el Sr. Huarote y

    cinco para el Sr. Martnez.

    X : es la suma de todas las observaciones (ventas). Es

    $ 195.

    k : es el nmero de tratamientos (vendedores). Hay

    tres.

    N : es el nmero total de observaciones. Hay 15.

  • Sr. Quiroz Sr. Huarote Sr. Martnez

    1X 2

    1X 2X 2

    2X 3X 2

    3X 15 225 15 225 19 361

    10 100 10 100 12 144

    9 81 12 144 16 256

    5 25 11 121 16 256

    16 256 12 144 17 289 Total

    Totales de columna: 55 60 80 195

    Tamao de muestra 5 5 5 15

    Suma de cuadrados 687 734 1306 2727

    Clculo de SST

    70535,2605,215

    )195(

    5

    )80(

    5

    )60(

    5

    )55()( 22222

    N

    X

    n

    TSST

    c

    c

    Clculo de SSE

    122605,2727,22

    2

    c

    c

    n

    TXSSE

    La variacin total (Total SS) es la suma de la variacin entre columnas y entre renglones; es decir,

    Total SS = SST + SSE = 70 + 122 = 192.

  • Verificacin

    192535,2727,215

    )195(727,2

    )( 222

    N

    XXSSTotal

    Las tres sumas de cuadrados y los clculos necesarios para determinar F, se presentan en el

    siguiente cuadro:

    Fuente de Suma de Grados de Cuadrados

    variacin cuadrados libertad medios

    Entre tratamientos SST= 70 k 1=3-1=2 70/2=35 = MSTR

    Error (en los tratamientos) SSE=122 N k=15-3=12 122/12 =10.17= MSE

    Total SS Total SS=192

    Clculo de F

    44.317.10

    351

    MSE

    MSTR

    kN

    SSEk

    SST

    F

  • La regla de decisin indica que si el valor calculado de F es

    menor que o igual al valor crtico de 3.89, la hiptesis nula

    se acepta. Si el valor de F es mayor que 3.89, la hiptesis

    nula se rechaza y la hiptesis alternativa se acepta. Puesto

    que 3.44 < 3.89, la hiptesis nula se acepta al nivel 0.05. En

    otras palabras, las diferencias en las ventas medias

    mensuales ($11,000, $12,000 y $16,000) se atribuyen al azar

    (muestreo). Desde el punto de vista prctico, los niveles de

    ventas de los tres vendedores que se consideran para el

    puesto de gerente de almacn son iguales. No puede tomarse

    una decisin respecto al puesto, con base en las ventas

    mensuales

  • Ejemplo

    Un profesor pidi a los estudiantes de un grupo grande del curso de

    estadstica que evaluara su desempeo en el curso como 1 (excelente),

    2 (bueno), 3 (aceptable) o 4 (deficiente). Un ayudante del profesor

    recolect las evaluaciones y asegur a los estudiantes que el profesor

    no las recibira hasta despus que las calificaciones del curso se

    hubieran ingresado en la Direccin Acadmica. La evaluacin (el

    tratamiento) que un estudiante asign al profesor se compar con su

    calificacin final del curso. Lgicamente, se esperara que en general, el

    grupo de estudiantes que pens que el profesor era excelente tuvieran

    una calificacin promedio final del curso significativamente ms alta que

    los alumnos que lo evaluaron como bueno, aceptable o regular, o

    deficiente. Tambin se esperara que los alumnos que lo evaluaron

    como deficiente tuvieran las calificaciones promedio ms bajas.

  • Se seleccionaron muestras de cada grupo de evaluacin. Los resultados son:

    Excelente Bueno Regular Deficiente

    94 75 70 68

    90 68 73 70

    85 77 76 72

    80 83 78 65

    88 80 74

    68 65

    65

    La pregunta es si existe o no una diferencia estadstica entre la puntuacin media de los

    cuatro grupos.

  • Se seleccion el nivel de significacin 0.01.

    La regla de decisin es que la hiptesis nula, que plantea que no

    hay diferencia entre las medias, no se rechazar si el valor

    calculado de F es menor que el valor crtico. De otra manera, la

    hiptesis nula se rechazar y se aceptar la hiptesis alternativa.

  • Recurdese que los grados de libertad en el numerador de la

    razn F se obtienen por k 1, donde k es el nmero de

    tratamientos (grupos de evaluacin del profesor). Hay cuatro

    tratamientos, de manera que 4 1 = 3 g.l. Los grados de libertad

    en el denominador son en total 18, que se obtienen mediante N

    k, en donde N es el nmero total de estudiantes en la muestra.

    Hay 22 estudiantes, por lo que 22 4 = 18 g.l.

    Obsrvese que el valor crtico de F es 5.09, de acuerdo al

    valor indicado en la tabla correspondiente. La regla de decisin

    ser: acepte la hiptesis nula al nivel 0.01 si el valor calculado de

    F es menor que o igual a 5.09, y rechace la hiptesis nula si el

    valor calculado es mayor que 5.09.

  • Los clculos necesarios para determinar la razn F se muestran en la siguiente tabla:

    Excelente Bueno Aceptable Deficiente

    1X 2

    1X 2X 2

    2X 3X 2

    3X 4X 2

    4X

    94 8836 75 5625 70 4900 68 4624

    90 8100 68 4624 73 5329 70 4900

    85 7225 77 5929 76 5776 72 5184

    80 6400 83 6889 78 6084 65 4225

    88 7744 80 6400 74 5476

    68 4624 65 4225

    65 4225

    cT 349 391 510 414

    cn 4 5 7 6

    2X 30561 30811 37338 28634

    Ntese que la suma de los totales por columna )( ix es 1 664; el total de los tamaos de muestras (N) es 22; y la suma de los cuadrados 127344.

    Calculando SST, SSE y total SS, se obtiene:

    68.89022

    )1664(

    6

    )414(

    7

    )510(

    5

    )391(

    4

    )349()( 2222222

    N

    X

    n

    TSST

    c

    c

    41.59459.1267491273442

    2

    c

    c

    n

    TXSSE

    Total SS = SST + SSE = 890.68 + 594.41 = 1485.09

    Como verificacin:

    09.14859.12585812734422

    )1664(127344

    )( 222

    N

    XXSSTotal

  • Estos valores se colocan en la tabla ANOVA:

    Fuente de Suma de Grados de Cuadrados

    variacin cuadrados libertad medios

    Tratamiento (entre columnas) SST= 890.68 k 1=4-1=3 890.68/3=296.89 MSTR

    Error (entre renglones) SSE=594.41 N k=22-4=18 594.41/18 =33.02= MSE

    Total SS Total SS=1485.09

    Introduciendo los cuadrados medios en la frmula de F, se obtiene:

    99.802.33

    89.296

    MSE

    MSTRF

  • La decisin: como el valor calculado de F de 8.99 es

    mayor que el valor crtico de 5.09, la hiptesis nula de

    que no existe diferencia entre las medias se rechaza al

    nivel 0.01. Bsicamente esto indica que es muy

    probable que las diferencias observadas entre las

    medias no se deban al azar. Desde el punto de vista

    prctica, se sugiere que las calificaciones que

    obtuvieron los estudiantes en un curso estn

    relacionadas con las opiniones que tienen de la

    capacidad general y la forma como se conduce en clase

    el profesor.

  • Inferencias acerca de las medias de

    tratamiento

    Supngase que al aplicar el procedimiento ANOVA,

    se decide rechazar la hiptesis nula. Esto permite concluir

    que todas las medias de tratamiento no son iguales. Algunas

    veces esta conclusin puede considerarse satisfactoria, pero

    en otros casos se desea saber cules medias de tratamiento

    son diferentes.

    En este ejemplo, la hiptesis nula se rechaz y la

    alternativa se acept. Si las opiniones de los estudiantes

    son en realidad diferentes, la pregunta es: Entre qu

    grupos difieren las medias de tratamiento?

    Existen varios procedimientos para responder esta

    pregunta. Tal vez el ms sencillo es mediante el uso de

    niveles de confianza.

  • La distribucin t se utiliza como base para esta prueba. Recurdese que una suposicin bsica de ANOVA es que las varianzas poblacionales son iguales para todos los tratamientos. Como se observ, este valor poblacional comn se denomina error cuadrado medio (MSE) que se obtiene mediante SSE/(N-k).

  • Un intervalo de confianza para la diferencia entre dos medias poblacionales

    se logra mediante:

    21

    21

    11)(

    nnMSEtxx

    1x : es la media del primer tratamiento.

    2x : es la media del segundo tratamiento

    t : se obtiene a partir del la tabla t. Los grados de libertad son N k.

    MSE : es el error cuadrado medio que se obtiene a partir de la tabla

    ANOVA.

    1n : es el nmero de observaciones en el primer tratamiento.

    2n : es el nmero de observaciones en el segundo tratamiento.

  • Si el intervalo de confianza incluye al 0, se

    concluye que no hay diferencia en el par de medias de

    tratamiento. Sin embargo, si ambos extremos del intervalo

    de confianza tienen el mismo signo, esto indica que las

    medias de tratamiento son diferentes.

    Utilizando el ejemplo anterior acerca de las

    opiniones de estudiantes y el nivel de confianza de 0.95,

    los extremos del intervalo de confianza son 10.46 y 26.04,

    que se obtienen por:

  • 04.2646.10

    79.725.18

    6

    1

    4

    10.33101.2)00.6925.87(

    11)(

    21

    21

    y

    nnMSEtxx

    Se conoce que el intervalo de confianza de 95% vara de 10.46 hasta 26.04. Ambos extremos

    son positivos; en consecuencia, podemos concluir que estas medias de tratamiento difieren

    significativamente. Es decir, los estudiantes que evaluaron al profesor como excelente tienen

    calificaciones ms altas que los que lo evaluaron como malo.

  • Precaucin

    La investigacin de diferencias de medias

    de tratamiento es un proceso secuencial. El

    paso inicial es realizar la prueba ANOVA.

    Slo si se rechaza, la hiptesis nula de que

    la medias de tratamiento son iguales, debe

    intentarse llevar a cabo cualquier anlisis

    de las medias de tratamiento

  • ANOVA en dos sentidos

    Una compaa de autobuses, est ampliando el

    servicio desde el centro de Lima al Aeropuerto por cuatro

    rutas diferentes. La Empresa realiz recorridos de prueba

    para determinar si hay diferencia significativa en los tiempos

    medios del trayecto en las cuatro rutas. Los tiempos del

    trayecto en minutos en cada una de las cuatro rutas se

    muestran a continuacin:

  • Tiempo del recorrido del Centro al Aeropuerto

    Da Ruta 1 Ruta 2 Ruta 3 Ruta 4

    Lunes 18 20 20 22

    Martes 21 22 24 24

    Mircoles 20 23 25 23

    Jueves 25 21 28 25

    Viernes 26 24 28 25

    Al nivel de significancia 0.05, puede concluirse que hay diferencia en las cuatro rutas?

    Existe una diferencia dependiendo de qu da de la semana se trata?

  • En este caso, el da de la semana se denomina variable de bloque. En consecuencia, se tiene

    variacin debida al tratamiento y debida a los bloques. La suma de cuadrados debida a los bloques

    (SSB) se calcula como sigue:

    N

    x

    k

    BSSB r

    22 )(

    en donde Br se refiere al total del bloque, es decir, al total de cada rengln, y k es el nmero de

    elementos en cada bloque.

    El mismo formato que sirve para el caso de ANOVA en un sentido se utiliza para la tabla

    ANOVA en dos sentidos. Los totales de SST y SS se calculan igual que antes. SSE se obtiene por

    sustraccin (SSE = Total SS SST SSB). En la siguiente tabla se muestran los clculos necesarios:

  • Tiempo de viaje, por ruta (minutos)

    Da Ruta 1 Ruta 2 Ruta 3 Ruta 4 Suma de

    renglones Br

    Lunes 18 20 20 22 80

    Martes 21 22 24 24 91

    Mircoles 20 23 25 23 91

    Jueves 25 21 28 25 99

    Viernes 26 24 28 25 103 Totales

    Totales por columna, Tc 110 110 125 119 464

    Suma de cuadrados 2446 2430 3169 2839 10904

    Tamao de la muestra nc 5 5 5 5 20

    Anlogo a la tabla ANOVA para un anlisis en un sentido, el formato general en dos sentidos

    es:

    Fuente de variacin Suma de cuadrados Grados libertad Cuadrado medio

    Tratamientos SST k - 1 MSTR

    k

    SST

    1

    Bloque SSB n -1 MSB

    n

    SSB

    1

    Error SSE (k-1)(n-1) MSE

    nk

    SSE

    )1)(1(

    Total Total SS

  • Como antes, para calcular SST:

    4.3220

    )464(

    5

    )119(

    5

    )125(

    5

    )110(

    5

    )110()( 2222222

    N

    X

    n

    TSST

    c

    c

    SSB se obtiene mediante:

    2.7820

    )464(

    4

    )103(

    4

    )99(

    4

    )91(

    4

    )91(

    4

    )80()( 22222222

    N

    x

    k

    BSSB r

    Los dems trminos de suma de cuadrados son:

    2.13920

    )464(10904

    )( 222

    N

    XXSSTotal

    SSE = Total SS SST SSB=139.2 32.4 78.2 = 28.6

  • Los valores para los diferentes componentes de la tabla ANOVA se calculan de la siguiente manera:

    Fuente de variacin Suma de cuadrados Grados libertad Cuadrado medio

    Tratamientos 32.4 3 8.10

    3

    4.32

    Bloque 78.2 4 55.19

    4

    2.78

    Error 28.6 12 38.2

    12

    6.28

    Total 139.0

  • 1.- 43210 : H . Las medias de tratamiento son iguales.

    :1H Las medias de tratamiento no son iguales.

    2.- 543210 : H . Las medias de bloques son iguales.

    1H : Las medias de bloques no son iguales.

  • Primero se demostrar la hiptesis sobre las medias de tratamiento. Hay k 1 = 4 1 = 3 grados de

    libertad en el numerador y (k 1) (n 1) = (4 1) (5 1) = 12 grados de libertad en el

    denominador. Al nivel de significancia 0.05, el valor crtico de F es 3.49. La hiptesis nula de que

    los tiempos medios para las cuatro rutas son iguales se rechaza si la razn F es mayor que 3.49.

    54.438.2

    8.10

    MSE

    MSTRF

    La hiptesis nula se rechaza y se acepta la hiptesis alternativa. Se concluye que el tiempo

    promedio de trayecto no es igual para todas las rutas. La empresa desea efectuar algunas pruebas

    para determinar qu medias de tratamiento difieren.

  • A continuacin, se hace una prueba para determinar si el tiempo del trayecto es igual para

    diferentes das de la semana. Los grados de libertad en el numerador para bloques es n 1 = 5 1 =

    4. Los grados de libertad en el denominador son igual que antes, es decir, 12. La hiptesis nula de

    que las medias de bloques son iguales se rechaza si la razn F es mayor que 3.26.

    21.838.2

    55.19

    MSE

    MSBF

    La hiptesis nula se rechaza, y la hiptesis alternativa se acepta. El tiempo promedio del

    trayecto no es igual para los diferentes das de la semana.

  • En MINITAB los resultados son los siguientes:

    Two-way Analysis of Variance Analysis of Variance for Tiempos

    Source DF SS MS F P

    rutas 3 32.40 10.80 4.53 0.024

    dias 4 78.20 19.55 8.20 0.002

    Error 12 28.60 2.38

    Total 19 139.20

    Individual 95% CI

    rutas Mean ----+---------+---------+---------+-------

    1 22.00 (---------*---------)

    2 22.00 (---------*---------)

    3 25.00 (---------*---------)

    4 23.80 (---------*---------)

    ----+---------+---------+---------+-------

    21.00 22.50 24.00 25.50

  • Individual 95% CI

    dias Mean -------+---------+---------+---------+----

    1 20.00 (------*------)

    2 22.75 (------*------)

    3 22.75 (------*------)

    4 24.75 (------*------)

    5 25.75 (------*------)

    -------+---------+---------+---------+----

    20.00 22.50 25.00 27.50

    Estadstica para Administracin y Economa, Mason y Lind