ESTADISTICA INFERENCIAL II.pdf
-
Upload
jhulio-cesar-mtz -
Category
Documents
-
view
214 -
download
8
Embed Size (px)
Transcript of ESTADISTICA INFERENCIAL II.pdf

ESTADISTICA INFERENCIAL II
ALBERTO GARCIA ESPINOSA

OBJETIVOS GENERALES DEL CURSO
● Conocer y aplicar técnicas de diseño experimental, con el
objeto de tomar decisiones para analizar, evaluar y mejorar
procesos logísticos e industriales.
● Adquirir criterios y herramientas de diseño experimental para
planificar experimentos eficazmente en los procesos logísticos
e industriales.
● Desarrollar las habilidades para la aplicación de las
herramientas y procedimientos habituales del análisis
estadístico para la obtención de conclusiones válidas.

OBJETIVOS GENERALES DEL CURSO
● Conocer y aplicar las series de tiempo en sistemas logísticos e
industriales para determinar los pronósticos para la planeación
de los recursos necesarios para responder a los cambios de la
demanda.
● Identificar, aplicar y analizar mediante técnicas de regresión,
para evaluar los procesos de soporte en la toma de decisiones
en la solución de problemas.

TEMARIO
● UNIDAD I. Regresión lineal simple y múltiple.
● UNIDAD II. Diseño de experimentos de un factor.
● UNIDAD III. Diseño de bloques.
● UNIDAD IV. Conceptos básicos en diseños factoriales.
● UNIDAD V. Series de tiempo.

FUENTES DE INFORMACION
● Douglas C. Montgomery, Design and Analysis of Experiments,
6th. Ed. Wiley 2004.
● Mendenhall W., Introducción a la probabilidad y la estadística,
Wadsworth, Inc., 1982.
● Murray R. Spiegel, Estadística, 2da. Ed. McGraw-Hill, 1991.
● Fuenlabrada Samuel, Probabilidad y estadística, McGraw-Hill,
México, 2004.

CRITERIOS DE EVALUACIÓN
● Examen--------------------------------50%
● Asistencia-----------------------------10%
● Tareas----------------------------------10%
● Participaciones-----------------------10%
● Portafolio de evidencias-------------20%

UNIDAD II. Diseño de experimentos de un factor
● 2.1 Familia de diseños para comparar tratamientos
● 2.2 El modelo de efectos fijos
● 2.3 Diseño completamente aleatorio y ANOVA
● 2.4 Comparaciones o pruebas de rangos múltiples
● 2.5 Verificación de los supuestos del modelo
● 2.6 Uso de un software estadístico

UNIDAD II. Diseño de experimentos de un factor
Experimentos con un solo factor
En este tipo de diseño de experimento se considera un sólo factor de
interés y el objetivo es comparar más de dos tratamientos, con el fin
de elegir la mejor alternativa entre las varias que existen, o por lo
menos para tener una mejor comprensión del comportamiento de la
variable de interés en cada uno de los distintos tratamientos.
Puede ser de interés comparar tres o más máquinas, varios
proveedores, cuatro procesos, tres materiales, cinco dosis de un
fármaco, etc.
Es obvio que, al hacer tales comparaciones, existe un interés y un
objetivo claro.

UNIDAD II. Diseño de experimentos de un factor
Ejemplo:
Una comparación de cuatro dietas de alimentación en la que se utilizan
ratas de laboratorio, se hace con el fin de estudiar si alguna dieta que
se propone es mejor o igual que las que ya existen; en este caso, la
variable de interés es el peso promedio alcanzado por cada grupo de
animales después de ser alimentado con la dieta que le toco.

UNIDAD II. Diseño de experimentos de un factor
Por lo general, el interés del experimentador está centrado en comparar
los tratamientos en cuanto a sus medias poblacionales, sin olvidar
que también es importante compararlos con respecto a sus
varianzas. Así, desde el punto de vista estadístico, la hipótesis
fundamental a probar cuando se comparan varios tratamientos es:
H0 = µ1 = µ2 = ... µn
H1 = µi ≠ µj para algún i ≠ j
Con la cual se quiere decidir si los tratamientos son iguales
estadísticamente en cuanto a sus medias, frente a la alternativa de
que al menos dos de ellos son diferentes.

UNIDAD II. Diseño de experimentos de un factor
La estrategia natural para resolver este problema es obtener una
muestra representativa de mediciones en cada uno de los
tratamientos, y construir un estadístico de prueba para decidir el
resultado de dicha comparación.
Se podría pensar que una forma de probar la hipótesis nula de es
mediante la prueba T de Student aplicadas a todos los posibles pares
de medias; sin embargo, esta manera de proceder incrementaría de
manera considerable el error tipo I (rechazar H0 siendo verdadera).

UNIDAD II. Diseño de experimentos de un factor
Ejemplo:
En el caso de comparar varias máquinas, si cada máquina es manejada
por un operador diferente y se sabe que éste tiene una influencia en
el resultado, entonces, es claro que el factor operador debe tomarse
en cuenta si se quiere comparar a las máquinas de manera justa.
Un operador más hábil puede ver a su máquina (aunque ésta sea la
peor) como la que tiene el mejor desempeño, lo que impide una
comparación adecuada de los equipos.
Para evitar este sesgo habría dos maneras de anular el posible efecto
del factor operador:

UNIDAD II. Diseño de experimentos de un factor
● Utilizando el mismo operador en las cuatro máquinas. Esta estrategia
no es aconsejable, ya que al utilizar el mismo operador, se elimina el
efecto del factor operador, pero restringe la validez de la
comparación a dicho operador, y es posible que el resultado no se
mantenga al utilizar otros operadores.
● Cada operador trabaje durante el experimento con cada una de las
máquinas, esta estrategia es más recomendable, ya que al utilizar
todos los operadores con todas las máquinas permite tener
resultados de la comparación que son válidos para todos los
operadores.
● Esta última de manera nulificar el efecto de operadores, recibe el
nombre de Bloqueo.

UNIDAD II. Diseño de experimentos de un factor
Factores de bloqueo.
Son factores adicionales al factor de interés que se incorporan de
manera explícita en un experimento comparativo, para estudiar de
manera más adecuada y eficaz al factor de interés.
NOTA: Cuando se comparan varias máquinas, manejadas por
operadores diferentes, es pertinente incluir explícitamente al factor
operadores (bloques) para lograr el propósito del estudio. También se
podrían controlar el tipo de material, lotes, tipo de producto, día,
turno, etc. Se controlan factores que por conocimiento del proceso o
experiencia previa, se sabe que pueden afectar en forma sensible el
resultado de la comparación

UNIDAD II. Diseño de experimentos de un factor
En el campo de la industria es frecuente hacer experimentos o pruebas
con la intención de resolver un problema o comprobar una idea
(conjetura, hipótesis); por ejemplo, hacer algunos cambios en los
materiales, métodos o condiciones de operación de un proceso,
probar varias temperaturas en una máquina hasta encontrar la que
de el mejor resultado o crear un nuevo material con la intención de
lograr mejoras o eliminar algún problema.
Sin embargo, es común que estas pruebas o experimentos se hagan
sobre la marcha, con base en el ensayo y error, apelando a la
experiencia y a la intuición, en lugar de seguir un plan experimental
adecuado que garantice una buena respuesta a las interrogantes
planteadas.

UNIDAD II. Diseño de experimentos de un factor
Algo similar ocurre con el análisis de los datos experimentales, donde
más que hacer un análisis riguroso de toda la información obtenida y
tomar en cuenta la variación, se realiza un análisis informal, ¨intuitivo¨
Es tal el poder de la experimentación que, en ocasiones, se logra
mejoras a pesar de que el experimento se hizo con base en el
ensayo y error.
Sin embargo, en situaciones de cierta complejidad no es suficiente
aplicar este tipo de experimentación, por lo que es mejor proceder
siempre en una forma eficaz que garantice la obtención de las
respuestas a las interrogantes planteadas en un lapso corto de
tiempo y utilizando pocos recursos.

UNIDAD II. Diseño de experimentos de un factor
El diseño estadístico de experimentos es precisamente la forma más
eficaz de hacer pruebas. El diseño de experimentos consiste en
determinar cuáles pruebas se deben realizar y de qué manera, para
obtener datos que, al ser analizados estadísticamente, proporcionen
evidencias objetivas que permitan responder las interrogantes
planteadas, y de esa manera clarificar los aspectos inciertos de un
proceso, resolver un problema o lograr mejoras.

UNIDAD II. Diseño de experimentos de un factor
Algunos problemas típicos que pueden resolverse con el diseño y el
análisis de experimentos son los siguientes:
1. Comparar a dos o más materiales con el fin de elegir al que mejor
cumple los requerimientos.
2. Comparar varios instrumentos de medición para verificar si trabajan
con la misma precisión y exactitud.
3. Determinar los factores (las x vitales) de un proceso que tienen
impacto sobre una o más características del producto final.

UNIDAD II. Diseño de experimentos de un factor
4. Encontrar las condiciones de operación (temperatura, velocidad,
humedad, por ejemplo) donde se reduzcan los defectos o se logre un
mejor desempeño del proceso.
5. Reducir el tiempo de ciclo del proceso.
6. Hacer el proceso insensible o robusto a oscilaciones de variables
ambientales.
7. Apoyar el diseño o rediseño de nuevos productos o procesos
8. Ayudar a conocer y caracterizar nuevos materiales.

UNIDAD II. Diseño de experimentos de un factor
En general, cuando se requiere mejorar un proceso existen dos
maneras básicas de obtener la información necesaria para ello:
● Observar o monitorear vía herramientas estadísticas, hasta obtener
señales útiles que permitan mejorarlo; se dice que ésta es una
estrategia pasiva.
● La otra manera consiste en experimentar, es decir, hacer cambios
estratégicos y deliberados al proceso para provocar dichas señales
útiles.

UNIDAD II. Diseño de experimentos de un factor
Al analizar los resultados del experimento se obtienen las pautas a
seguir, que muchas veces se concretan en mejoras sustanciales del
proceso.
En este sentido, experimentar es mejor que sentarse a esperar a que el
proceso nos indique por sí solo cómo mejorarlo.
El diseño de experimentos es un conjunto de técnicas activas, en el
sentido de que no esperan que el proceso mande las señales útiles,
sino que éste se ¨manipulan¨ para que proporcione la información
que se requiere para su mejoría.

UNIDAD II. Diseño de experimentos de un factor
El saber diseño de experimentos y otras técnicas estadísticas, en
combinación con conocimientos del proceso, sitúan al responsable
del mismo como un observador perceptivo y proactivo que es capaz
de proponer mejoras y de observar algo interesante (oportunidades
de mejora) en el proceso y en los datos donde otra persona no ve
nada.

2.1 Familia de diseños para comparar tratamientos
Los diseños experimentales más utilizados para comparar tratamientos
son:
1. Diseño completamente al azar (DCA)
2. Diseño en bloque completamente al azar (DBCA)
3. Diseño en cuadro latino (DCL)
4. Diseño en cuadro grecolatino (DCGL)
La diferencia fundamental entre estos diseños es el número de factores
de bloque que incorporan o controlan de forma explícita durante el
experimento.

2.1 Familia de diseños para comparar tratamientos
La comparación de los tratamientos en cuanto a la respuesta media que
logran, en cualquiera de estos diseños, se hace mediante la
hipótesis:
H0 = µ1 = µ2 = ... µn
H1 = µi ≠ µj para algún i ≠ j
que se prueba con la técnica estadística llamada Análisis de Varianza
(ANOVA) con uno, dos, tres o cuatro criterios de clasificación,
dependiendo del número de factores de bloques incorporados al
diseño.

2.1 Familia de diseños para comparar tratamientos
El modelo estadístico que describe el comportamiento de la variable
observada Y en cada diseño, incorpora un término adicional por cada
factor de bloqueo controlado.

2.1 Familia de diseños para comparar tratamientos
De acuerdo con los modelos dados en la tabla, para cada diseño
comparativo se tienen al menos dos fuentes de variabilidad: los
tratamientos o niveles del factor de interés y el error aleatorio. Se
agrega una nueva fuente de variabilidad por cada factor de bloque
que se controla directamente.
Se observa que los diseños suponen que no hay efectos de interacción
entre los factores, lo cual sería lo deseable que ocurra; de no ocurrir
así, tal efecto se recarga al error y el problema de comparación no se
resuelve con éxito.
Un efecto de interacción entre dos factores hace referencia a que el
efecto de cada factor depende del nivel en que se encuentra el otro.

2.2 El modelo de efectos fijos
El modelo de efectos fijos (es cuando se estudian todos los posibles
tratamientos) de análisis de la varianza se aplica a situaciones en las
que el experimentador ha sometido al grupo o material analizado a
varios factores, cada uno de los cuales le afecta sólo a la media,
permaneciendo la "variable respuesta" con una distribución normal.
Este modelo se supone cuando el investigador se interesa únicamente
por los niveles del factor presentes en el experimento, por lo que
cualquier variación observada en las puntuaciones se deberá al error
experimental.

2.2 El modelo de efectos fijos
En caso que los tratamientos tengan efecto, las observaciones Yij se
podrán describir con el modelo estadístico lineal dado por:
La media global µ de la variable de respuesta no se considera una
fuente de variabilidad por ser una constante común a todos los
tratamientos, que hace las veces de punto de referencia con
respecto al cual se comparan las respuestas medias de los
tratamientos.

2.2 El modelo de efectos fijos
Si la respuesta media de un tratamiento particular µ1 es ¨muy diferente¨
de la respuesta media global µ, es un síntoma de que existe un
efecto de dicho tratamiento, ya que como se verá más adelante,
. La diferencia que deben tener las medias entre sí para concluir que
hay un efecto (que los tratamientos son diferentes), nos lo dice el
análisis de varianza (ANOVA).
En la práctica puede suceder que los tratamientos que se desea
comparar sean demasiados como para experimentar con todos.
Cuando esto sucede es conveniente comparar sólo una muestra de
la población de tratamientos.

2.3 Diseño completamente aleatorio y ANOVA
Muchas comparaciones, como las antes mencionadas, se hacen con
base en el diseño completamente al azar (DCA), que es el más
simple de todos los diseños que se utilizan para comparar dos o más
tratamientos, dado que sólo consideran dos fuentes de variabilidad:
los tratamientos y el error aleatorio.
Este diseño se llama completamente al azar porque todas las corridas
experimentales se realizan en orden aleatorio completo. De esta
manera, si durante el estudio se hacen en total N pruebas, éstas se
corren al azar, de manera que los posibles efectos ambientales y
temporales se vayan repartiendo equitativamente entre los
tratamientos.

2.3 Diseño completamente aleatorio y ANOVA
El análisis de la varianza de un criterio (ANOVA de un criterio) es una
metodología para analizar la variación entre muestras y la variación
al interior de las mismas con varianzas, en lugar de rangos. Como
tal, es un método estadístico útil para comparar dos o más medias
poblacionales.
El objetivo del análisis de varianza en el DCA es probar las hipótesis de
igualdad de los tratamientos con respecto a la media de la
correspondiente variable de respuesta:
H0 = µ1 = µ2 = ... = µk
H1 = µ1 ≠ µ2 ≠ al menos para alguna

2.3 Diseño completamente aleatorio y ANOVA
TAREA:
● Cálculo manual tradicional para ANOVA: requiere del cálculo de 2
estimaciones independientes para la varianza poblacional común σ².
Entre muestras (Método entre) y al interior de las muestras (Método
dentro).
● Cálculo simplificado y más práctico para ANOVA: notación de puntos.
● Diagramas de cajas simultáneos (box plots).

2.4 Comparaciones o pruebas de rangos múltiples
El análisis de varianza es un procedimiento poderoso para probar la
homogeneidad de un conjunto de medias. Sin embargo, si
rechazamos la hipótesis nula (H0) y aceptamos la alterna (que no
todas las medias son iguales) aún no sabemos cuáles de las medias
poblacionales son iguales y cuáles son diferentes.
Cuando no se rechaza la H0: µ1 = µ2 = µ3, el objetivo del experimento
está cubierto y la conclusión es que los tratamientos no son
diferentes. Si por el contrario se rechaza H0, y por consiguiente se
acepta la H1: No todas las poblaciones tienen la misma media, es
necesario investigar cuáles tratamientos resultaron diferentes, o
cuáles provocan la diferencia.

2.4 Comparaciones o pruebas de rangos múltiples
Estas interrogantes se responden probando la igualdad de todos los
posibles pares de medias, para lo cual se han propuesto varios
métodos, conocidos como métodos de comparaciones múltiples o
pruebas de rango múltiple.
La diferencia primordial entre los métodos radica en la potencia que
tienen para detectar las diferencias entre las medias. Se dice que
una prueba es más potente si es capaz de detectar diferencias más
pequeñas.

2.4 Comparaciones o pruebas de rangos múltiples
Métodos de comparaciones múltiples o pruebas de rango múltiple:
a) Método de la diferencia mínima significativa de Fisher (método LSD).
b) Método de Tukey
c) Método de Duncan
d) Método de Dunnet
TAREA

2.5 Verificación de los supuestos del modelo
La validez de los resultados obtenidos en cualquier análisis de varianza
queda supeditada a que los supuestos del modelo se cumplan.
Estos supuestos son:
A) Normalidad
B) Varianza constante (igual varianza de los tratamientos)
C) Independencia
Esto es, la respuesta (Y) se debe distribuir de manera normal, con la
misma varianza en cada tratamiento y las mediciones deben ser
independientes.

2.5 Verificación de los supuestos del modelo
Normalidad
Un procedimiento gráfico para verificar el cumplimiento del supuesto de
normalidad de los residuos consiste en graficar los residuos en papel
o en la gráfica de probabilidad normal que se incluye casi en todos
los paquetes estadísticos. Esta gráfica del tipo X-Y tiene las escalas
de tal manera que si los residuos siguen una distribución normal, al
graficarlos tienden a quedar alineados en una línea recta; por lo
tanto, si claramente no se alinean se concluye que el supuesto de
normalidad no es correcto.
Cabe enfatizar el hecho de que el ajuste de los puntos a una recta no
tiene que ser perfecto, dado que el análisis de varianza resiste
pequeñas y moderadas desviaciones al supuesto de normalidad.

2.5 Verificación de los supuestos del modelo
Varianza constante
Una forma de verificar el supuesto de varianza constante (o que los
tratamientos tienen la misma varianza) es graficado los predichos
contra residuos ( ), por lo general va en el eje horizontal y los
residuos en el eje vertical. Si los puntos en esta gráfica se distribuyen
de manera aleatoria en una banda horizontal (sin ningún patrón claro
y contundente), entonces es señal d que se cumple el supuesto de
que los tratamientos tienen igual varianza. Por el contrario, si se
distribuyen con algún patrón claro y contundente, como por ejemplo
una forma de corneta o embudo, entonces es señal de que no se
está cumpliendo el supuesto de varianza constante.

2.5 Verificación de los supuestos del modelo
Independencia
La suposición de independencia en los residuos puede verificarse si se
grafica el orden en que se colectó un dato contra el residuo
correspondiente. De esta manera, si al graficar en el eje horizontal el
tiempo (orden de corrida) y en el eje vertical los residuos, se detecta
una tendencia o patrón no aleatorio claramente definido, esto es
evidencia de que existe una correlación entre los errores y, por lo
tanto, el supuesto de independencia no se cumple. Si el
comportamiento de los puntos es aleatorio dentro de una banda
horizontal, el supuesto se está cumpliendo.

2.5 Verificación de los supuestos del modelo
La violación de este supuesto generalmente indica deficiencias en la
planeación y ejecución del experimento; asimismo, puede ser un
indicador de que no se aplico en forma correcta el principio de
aleatorización, o de que conforme se fueron realizando las pruebas
experimentales aparecieron factores que afectaron la respuesta
observada.
Por ello, en caso de tener problemas con este supuesto, las
conclusiones que se obtienen del análisis son endebles y por ello es
mejor revisar lo hecho y tratar de investigar por qué no se cumplió
con ese supuesto de independencia, a fin de reconsiderar la
situación.