introduccion_dde

download introduccion_dde

of 19

Transcript of introduccion_dde

  • 8/3/2019 introduccion_dde

    1/19

    2.1 Introduccin.

    Los modelos de Diseo de experimentos son modelos estadsticos clsicos cuyoobjetivo es averiguar si unos determinados factores influyen en la variable deinters y, si existe influencia de algn factor, cuantificarla. Ejemplos donde

    habra que utilizar estos modelos son los siguientes:

    En el rendimiento de un determinado tipo de mquinas (unidades producidaspor da) se desea estudiar la influencia del trabajador que la maneja y lamarca de la mquina.

    Se quiere estudiar la influencia del tipo de pila elctrica y de la marca en laduracin de las pilas.

    Una compaa telefnica est interesada en conocer la influencia de variosfactores en la variable de inters la duracin de una llamada telefnica. Los

    factores que se consideran son los siguientes: hora a la que se produce lallamada; da de la semana en que se realiza la llamada; zona de la ciudaddesde la que se hace la llamada; sexo del que realiza la llamada; tipo detelfono (pblico o privado) desde el que se realiza la llamada.

    Una compaa de software est interesada en estudiar la variable porcentajeque se comprime un fichero al utilizar un programa que comprime ficherosteniendo en cuenta el tipo de programa utilizado y el tipo de fichero que secomprime.

    Se quiere estudiar el rendimiento de los alumnos en una asignatura y, para

    ello, se desean controlar diferentes factores: profesor que imparte laasignatura; mtodo de enseanza; sexo del alumno.

    La metodologa del diseo de experimentos se basa en la experimentacin. Esconocido que si se repite un experimento, en condiciones indistinguibles, losresultados presentan variabilidad que puede ser grande o pequea. Si laexperimentacin se realiza en un laboratorio donde la mayora de las causas devariabilidad estn muy controladas, el error experimental ser pequeo y habrpoca variacin en los resultados del experimento. Pero si se experimenta enprocesos industriales, administrativos, ... la variabilidad es grande en la mayorade los casos.

    El objetivo del diseo de experimentos es estudiar si utilizar un determinadotratamiento produce una mejora en el proceso o no. Para ello se debeexperimentar utilizando el tratamiento y no utilizndolo. Si la variabilidadexperimental es grande, slo se detectar la influencia del uso del tratamientocuando ste produzca grandes cambios en relacin con el error de observacin.

  • 8/3/2019 introduccion_dde

    2/19

    La metodologa del Diseo de Experimentos estudia cmo variar las condicioneshabituales de realizacin de un proceso emprico para aumentar la probabilidadde detectar cambios significativos en la respuesta, de esta forma se obtiene unmayor conocimiento del comportamiento del proceso de inters.

    Para que la metodologa de diseo de experimentos sea eficaz es fundamentalque el experimento est bien diseado.

    Un experimento se realiza por alguno de los siguientes motivos:

    *Determinar las principales causas de variacin en la respuesta.

    *Encontrar las condiciones experimentales con las que se consigue un valorextremo en la variable de inters o respuesta.

    *Comparar las respuestas en diferentes niveles de observacin de variables

    controladas.

    *Obtener un modelo estadstico-matemtico que permita hacer prediccionesde respuestas futuras.

    La utilizacin de los modelos de diseo de experimentos se basa en laexperimentacin y en el anlisis de los resultados que se obtienen en unexperimento bien planificado. En muy pocas ocasiones es posible utilizar estosmtodos a partir de datos disponibles o datos histricos, aunque tambin sepuede aprender de los estudios realizados a partir de datos recogidos porobservacin, de forma aleatoria y no planificada. En el anlisis estadstico de

    datos histricos se pueden cometer diferentes errores, los ms comunes son lossiguientes:

    Inconsistencia de los datos. Los procesos cambian con el tiempo, se producencambios en el personal (cambios de personas, mejoras del personal porprocesos de aprendizaje, motivacin, ...), cambios en las mquinas(reposiciones, reparaciones, envejecimiento, ...). Estos cambios tieneninfluencia en los datos recogidos, lo que hace que los datos histricos seanpoco fiables, sobre todo si se han recogido en un amplio espacio de tiempo.

    Variables con fuerte correlacin. Puede ocurrir que en el proceso existan doso ms variables altamente correlacionadas que pueden llevar a situaciones

    confusas. Por ejemplo, en el proceso hay dos variables X1 y X2 fuertementecorrelacionadas que influyen en la respuesta, pero si en los datos que se tieneaumenta al mismo tiempo el valor de las dos variables no es posible distinguirsi la influencia es debida a una u otra o a ambas variables (confusin de losefectos). Otra situacin problemtica se presenta si solo se dispone de datosde una variable (por ejemplo de X1 y no deX2), lo que puede llevar a pensarque la variable influyente es laX1 cuando, en realidad, la variable influyentees laX2 (variable oculta).

  • 8/3/2019 introduccion_dde

    3/19

    El rango de las variables controladas es limitado. Si el rango de una de lasvariables importantes e influyentes en el proceso es pequeo, no se puedesaber su influencia fuera de ese rango y puede quedar oculta su relacin conla variable de inters o lo cambios que se producen en la relacin fuera delrango observado. Esto suele ocurrir cuando se utilizan los datos recogidos al

    trabajar el proceso en condiciones normales y no se experimenta (cambiandolas condiciones de funcionamiento) para observar el comportamiento delproceso en situaciones nuevas.

    2.2 Tipos de variabilidad.

    Uno de los principales objetivos de los modelos estadsticos y, en particular, delos modelos de diseo de experimentos, es controlar la variabilidad de unproceso estocstico que puede tener diferente origen. De hecho, los resultadosde cualquier experimento estn sometidos a tres tipos de variabilidad cuyas

    caractersticas son las siguientes:

    Variabilidad sistemtica y planificada.

    Esta variabilidad viene originada por la posible dispersin de los resultadosdebida a diferencias sistemticas entre las distintas condiciones experimentalesimpuestas en el diseo por expreso deseo del experimentador. Es el tipo devariabilidad que se intenta identificar con el diseo estadstico.

    Cuando este tipo de variabilidad est presente y tiene un tamao importante, seespera que las respuestas tiendan a agruparse formando grupos (clusters).

    Es deseable que exista esta variabilidad y que sea identificada y cuantificada porel modelo.

    Variabilidad tpica de la naturaleza del problema y del experimento.

    Es la variabilidad debida al ruido aleatorio. Este trmino incluye, entre otros, ala componente de variabilidad no planificada denominada error de medida. Esuna variabilidad impredecible e inevitable.

    Esta variabilidad es la causante de que si en un laboratorio se toman medidasrepetidas de un mismo objeto ocurra que, en muchos casos, la segunda medidano sea igual a la primera y, ms an, no se puede predecir sin error el valor de latercera. Sin embargo, bajo el aparente caos, existe un patrn regular decomportamiento en esas medidas: todas ellas tendern a fluctuar en torno a unvalor central y siguiendo un modelo de probabilidad que ser importanteestimar.

  • 8/3/2019 introduccion_dde

    4/19

    Esta variabilidad es inevitable pero, si el experimento ha sido bien planificado,es posible estimar (medir) su valor, lo que es de gran importancia para obtenerconclusiones y poder hacer predicciones.

    Es una variabilidad que va a estar siempre presente pero que es tolerable.

    Variabilidad sistemtica y no planificada.

    Esta variabilidad produce una variacin sistemtica en los resultados y es debidaa causas desconocidas y no planificadas. En otras palabras, los resultados estnsiendo sesgados sistemticamente por causas desconocidas. La presencia de estavariabilidad supone la principal causa de conclusiones errneas y estudiosincorrectos al ajustar un modelo estadstico.

    Como se estudiar posteriormente, existen dos estrategias bsicas para tratar deevitar la presencia de este tipo de varibilidad: la aleatorizacin y la tcnica de

    bloques.

    Este tipo de variabilidad debe de intentar evitarse y su presencia lleva aconclusiones errneas.

    2.3 Planificacin de un experimento.

    La experimentacin forma parte natural de la mayora de las investigacionescientficas e industriales, en muchas de las cuales, los resultados del proceso deinters se ven afectados por la presencia de distintos factores, cuya influenciapuede estar oculta por la variabilidad de los resultados muestrales. Es

    fundamental conocer los factores que influyen realmente y estimar estainfluencia. Para conseguir sto es necesario experimentar, variar las condicionesque afectan a las unidades experimentales y observar la variable respuesta. Delanlisis y estudio de la informacin recogida se obtienen las conclusiones.

    La forma tradicional que se utilizaba en la experimentacin, para el estudio deestos problemas, se basaba en estudiar los factores uno a uno, sto es, variar losniveles de un factor permaneciendo fijos los dems. Esta metodologa presentagrandes inconvenientes:

    *Es necesario un gran nmero de pruebas.

    *Las conclusiones obtenidas en el estudio de cada factor tiene un campo devalidez muy restringido.

    *No es posible estudiar la existencia de interaccin entre los factores.

    *Es inviable, en muchos casos, por problemas de tiempo o costo.

  • 8/3/2019 introduccion_dde

    5/19

    Las tcnicas de diseo de experimentosse basan en estudiar simultneamente losefectos de todos los factores de inters, son ms eficaces y proporcionanmejores resultados con un menor costo.

    A continuacin se enumeran las etapas que deben seguirse para una correcta

    planificacin de un diseo experimental, etapas que deben ser ejecutadas deforma secuencial. Tambin se introducen algunos conceptos bsicos en el estudiode los modelos de diseo de experimentos.

    Las etapas a seguir en el desarrollo de un problema de diseo de experimentosson las siguientes:

    1. Definir los objetivos del experimento.2. Identificar todas las posibles fuentes de variacin, incluyendo:

    factores tratamiento y sus niveles,

    unidades experimentales,

    factores nuisance (molestos): factores bloque, factores ruido ycovariables.

    3. Elegir una regla de asignacin de las unidades experimentales a las condicionesde estudio (tratamientos).

    4. Especificar las medidas con que se trabajar (la respuesta), el procedimientoexperimental y anticiparse a las posibles dificultades.

    5. Ejecutar un experimento piloto.6. Especificar el modelo.7. Esquematizar los pasos del anlisis.8. Determinar el tamao de la muestra.9. Revisar las decisiones anteriores. Modificarlas si se considera necesario.

    Los pasos del listado anterior no son independientes y en un determinadomomento puede ser necesario volver atrs y modificar decisiones tomadas enalgn paso previo.

    A continuacin se hace una breve descripcin de las decisiones que hay quetomar en cada uno de los pasos enumerados. Slo despus de haber tomado estasdecisiones se proceder a realizar el experimento.

    1.- Definir los objetivos del experimento.

    Se debe hacer una lista completa de las preguntas concretas a las que debe darrespuesta el experimento. Es importante indicar solamente cuestionesfundamentales ya que tratar de abordar problemas colaterales puede complicarinnecesariamente el experimento.

  • 8/3/2019 introduccion_dde

    6/19

    Una vez elaborada la lista de objetivos, puede ser til esquematizar el tipo deconclusiones que se espera obtener en el posterior anlisis de datos.

    Normalmente la lista de objetivos es refinada a medida que se van ejecutandolas etapas del diseo de experimentos.

    2.- Identificar todas las posibles fuentes de variacin.

    Una fuente de variacines cualquier cosa que pueda generar variabilidad en larespuesta. Es recomendable hacer una lista de todas las posibles fuentes devariacin del problema, distinguiendo aquellas que, a priori, generarn unamayor variabilidad. Se distinguen dos tipos:

    - Factores tratamiento: son aquellas fuentes cuyo efecto sobre la respuestaes de particular inters para el experimentador.

    - Factores nuisance: son aquellas fuentes que no son de inters directopero que se contemplan en el diseo para reducir la variabilidad no planificada.

    A continuacin se precisan ms estos importantes conceptos.

    (i) Factores y sus niveles.

    Se denomina factor tratamiento a cualquier variable de inters para elexperimentador cuyo posible efecto sobre la respuesta se quiere estudiar.

    Los nivelesde un factor tratamiento son los tipos o grados especficos del factor

    que se tendrn en cuenta en la realizacin del experimento.

    Los factores tratamiento pueden ser cualitativos o cuantitativos.

    Ejemplos de factores cualitativosy sus niveles respectivos:

    proveedor (diferentes proveedores de una materia prima), tipo de mquina (diferentes tipos o marcas de mquinas), trabajador (los trabajadores encargados de hacer una tarea), tipo de procesador (los procesadores de los que se quiere comparar su

    velocidad de ejecucin), un aditivo qumico (diferentes tipos de aditivos qumicos), el sexo (hombre y mujer), un mtodo de enseanza (un nmero determinado de mtodos de

    enseanza cuyos resultados se quieren comparar).

  • 8/3/2019 introduccion_dde

    7/19

    Ejemplos de factores cuantitativos son:

    tamao de memoria (diferentes tamaos de memoria de ordenadores), droga (distintas cantidades de la droga), la temperatura (conjuntos de temperaturas seleccionadas en unos

    rangos de inters).

    Debe tenerse en cuenta que en el tratamiento matemtico de los modelos dediseo de experimento los factores cuantitativos son tratados como cualitativos ysus niveles son elegidos equiespaciados o se codifican. Por lo general, un factorno suele tener ms de cuatro niveles.

    Cuando en un experimento se trabaja con ms de un factor, se denomina:

    Tratamiento a cada una de las combinaciones de niveles de los distintosfactores.

    Observacin es una medida en las condiciones determinadas por uno de lostratamientos.

    Experimento factorial es el diseo de experimentos en que existenobservaciones de todos los posibles tratamientos.

    (ii) Unidades experimentales.

    Son el material donde evaluar la variable respuesta y al que se le aplican los

    distintos niveles de los factores tratamiento.

    Ejemplos de unidades experimentales son:

    en informtica, ordenadores, pginas web, buscadores de internet, en agricultura, parcelas de tierra, en medicina, individuos humanos u animales, en industria, lotes de material, trabajadores, mquinas.

    Cuando un experimento se ejecuta sobre un perodo de tiempo de modo que las

    observaciones se recogen secuencialmente en instantes de tiempo determinados,entonces los propios instantes de tiempo pueden considerarse unidadesexperimentales.

    Es muy importante que las unidades experimentales sean representativas de lapoblacin sobre la que se han fijado los objetivos del estudio. Por ejemplo, si seutilizan los estudiantes universitarios de un pas como unidades experimentales,

  • 8/3/2019 introduccion_dde

    8/19

    las conclusiones del experimento no son extrapolables a toda la poblacin adultadel pas.

    (iii) Factores nuisance:bloques, factores ruido y covariables.

    En cualquier experimento, adems de los factores tratamiento cuyo efecto sobrela respuesta se quiere evaluar, tambin influyen otros factores, de escaso intersen el estudio, pero cuya influencia sobre la respuesta puede aumentarsignificativamente la variabilidad no planificada. Con el fin de controlar estainfluencia pueden incluirse en el diseo nuevos factores que, atendiendo a sunaturaleza, pueden ser de diversos tipos.

    Factor bloque. En algunos casos el factor nuisance puede ser fijado en distintosniveles, de modo que es posible controlar su efecto a esos niveles. Entonces laforma de actuar es mantener constante el nivel del factor para un grupo deunidades experimentales, se cambia a otro nivel para otro grupo y as

    sucesivamente. Estos factores se denominan factores de bloqueo (factores-bloque)y las unidades experimentales evaluadas en un mismo nivel del bloqueose dice que pertenecen al mismo bloque. Incluso cuando el factor nuisance no esmedible, a veces es posible agrupar las unidades experimentales en bloques deunidades similares: parcelas de tierra contiguas o perodos de tiempo prximosprobablemente conduzcan a unidades experimentales ms parecidas que parcelaso perodos distantes.

    Desde un punto de vista matemtico el tratamiento que se hace de los factores-bloque es el mismo que el de los factores-tratamiento en los que no hayinteraccin, pero su concepto dentro del modelo de diseo de experimentos es

    diferente. Un factor-tratamiento es un factor en el que se est interesado enconocer su influencia en la variable respuesta y un factor-bloque es un factor enel que no se est interesado en conocer su influencia pero se incorpora al diseodel experimento para disminuir la variabilidad residual del modelo.

    Covariable. Si el factor nuisance es una propiedad cuantitativa de las unidadesexperimentales que puede ser medida antes de realizar el experimento (eltamao de un fichero informtico, la presin sangunea de un paciente en unexperimento mdico o la acidez de una parcela de tierra en un experimentoagrcola). El factor se denomina covariabley juega un papel importante en elanlisis estadstico.

    Ruido. Si el experimentador est interesado en la variabilidad de la respuestacuando se modifican las condiciones experimentales, entonces los factoresnuisance son incluidos deliberadamente en el experimento y no se asla su efectopor medio de bloques. Se habla entonces de factores ruido.

    En resumen, las posibles fuentes de variacin de un experimento son:

  • 8/3/2019 introduccion_dde

    9/19

    Fuente Tipo

    Debida a las condiciones de inters

    (Factores tratamiento)

    Planificada y sistemtica

    Debida al resto de condiciones controladas

    (Factores nuisance)

    Planificada y sistemtica

    Debida a condiciones no controladas

    (error de medida, material experimental, ...)

    No planificada, pero sistemtica?

    3.- Elegir una regla de asignacin de las unidades experimentales a lascondicionesde estudio (tratamientos).

    La regla de asignacin o diseo experimental especifica qu unidadesexperimentales se observarn bajo cada tratamiento. Hay diferentesposibilidades:

    diseo factorial o no, anidamiento, asignacin al azar en determinados niveles de observacin, el orden de asignacin, etc.

    En la prctica, existen una serie de diseos estndar que se utilizan en lamayora de los casos.

    4.- Especificar las medidas que se realizarn (la respuesta), elprocedimientoexperimental y anticiparse a las posibles dificultades.

    Variable respuesta o variable de inters. Los datos que se recogen en un

    experimento son medidas de una variable denominada variable respuesta ovariable de inters.

    Es importante precisar de antemano cul es la variable respuesta y en quunidades se mide. Naturalmente, la respuesta est condicionada por los objetivosdel experimento. Por ejemplo, si se desea detectar una diferencia de 0'05gramosen la respuesta de dos tratamientos no es apropiado tomar medidas con unaprecisin prxima al gramo.

  • 8/3/2019 introduccion_dde

    10/19

    A menudo aparecen dificultades imprevistas en la toma de datos. Es convenienteanticiparse a estos imprevistos pensando detenidamente en los problemas que sepueden presentar o ejecutando un pequeo experimento piloto (etapa 5).Enumerar estos problemas permite en ocasiones descubrir nuevas fuentes devariacin o simplificar el procedimiento experimental antes de comenzar.

    Tambin se debe especificar con claridad la forma en que se realizarn lasmediciones: instrumentos de medida, tiempo en el que se harn las mediciones,etc.

    5.- Ejecutar un experimento piloto.

    Un experimento piloto es un experimento que utiliza un nmero pequeo deobservaciones. El objetivo de su ejecucin es ayudar a completar y chequear lalista de acciones a realizar. Las ventajas que proporciona la realizacin de unpequeo experimento piloto son las siguientes:

    permite practicar la tcnica experimental elegida e identificarproblemas no esperados en el proceso de recogida de datos,

    si el experimento piloto tiene un tamao suficientemente grandepuede ayudar a seleccionar un modelo adecuado al experimentoprincipal,

    los errores experimentales observados en el experimento piloto puedenayudar a calcular el nmero de observaciones que se precisan en elexperimento principal.

    6.- Especificar el modelo.

    El modelo matemtico especificado debe indicar la relacin que se supone queexiste entre la variable respuesta y las principales fuentes de variacinidentificadas en el paso 2. Es fundamental que el modelo elegido se ajuste a larealidad con la mayor precisin posible.

    El modelo ms habitual es el modelo lineal:

    En este modelo la respuesta viene dada por una combinacin lineal de trminosque representan las principales fuentes de variacin planificada ms un trminoresidual debido a las fuentes de variacin no planificada. El experimento pilotopuede ayudar a comprobar si el modelo se ajusta razonablemente bien a larealidad.

  • 8/3/2019 introduccion_dde

    11/19

    Los modelos de diseo de experimentos, segn sean los factores incluidos en elmismo, se pueden clasificar en: modelo de efectos fijos, modelo de efectosaleatorios y modelos mixtos. A continuacin se precisan estas definiciones.

    Factor de efectos fijos es un factor en el que los niveles han sido seleccionados

    por el experimentador. Es apropiado cuando el inters se centra en comparar elefecto sobre la respuesta de esos niveles especficos.

    Ejemplo: un empresario est interesado en comparar el rendimiento de tresmquinas del mismo tipo que tiene en su empresa.

    Factor de efectos aleatorios es un factor del que slo se incluyen en elexperimento una muestra aleatoria simple de todos los posibles niveles delmismo. Evidentemente se utilizan estos factores cuando tienen un nmero muygrande de niveles y no es razonable o posible trabajar con todos ellos. En estecaso se est interesado en examinar la variabilidad de la respuesta debida a la

    poblacin entera de niveles del factor.

    Ejemplo: una cadena de hipermercados que tiene en plantilla 300 trabajadoresde caja est interesada en estudiar la influencia del factor trabajador en lavariable tiempo en el cobro a un cliente.

    Modelo de efectos fijos es un modelo en el que todos los factores son factoresde efectos fijos.

    Modelo de efectos aleatorios es un modelo en el que todos los factores sonfactores de efectos aleatorios.

    Modelo mixto es un modelo en el que hay factores de efectos fijos y factores deefectos aleatorios.

    7.- Esquematizar los pasos del anlisis estadstico.

    El anlisis estadstico a realizar depende de:

    los objetivos indicados en el paso 1, el diseo seleccionado en el paso 3, el modelo asociado que se especific en el paso 5.

    Se deben esquematizar los pasos del anlisis a realizar que deben incluir:

    estimaciones que hay que calcular, contrastes a realizar, intervalos de confianza que se calcularn diagnosis y crtica del grado de ajuste del modelo a la realidad.

  • 8/3/2019 introduccion_dde

    12/19

    8.- Determinar el tamao de la muestra.

    Calcular el nmero de observaciones que se deben tomar para alcanzar losobjetivos del experimento.

    Existen, dependiendo del modelo, algunas frmulas para determinar estetamao. Todas ellas sin embargo requieren el conocimiento del tamao de lavariabilidad no planificada (no sistemtica y sistemtica, si es el caso) yestimarlo a priori no es fcil, siendo aconsejable sobreestimarla. Normalmente seestima a partir del experimento piloto y en base a experiencias previas entrabajos con diseos experimentales semejantes.

    9.- Revisar las decisiones anteriores. Modificar si es necesario.

    De todas las etapas enumeradas, el proceso de recogida de datos suele ser latarea que mayor tiempo consume, pero es importante realizar una planificacin

    previa, detallando los pasos anteriores, lo que garantizar que los datos seanutilizados de la forma ms eficiente posible.

    Es fundamental tener en cuenta que

    Ningn mtodo de anlisis estadstico, por sofisticado que sea, permiteextraer conclusiones correctas en un diseo de experimentos malplanificado.

    Recprocamente, debe quedar claro que el anlisis estadstico es una etapa msque est completamente integrado en el proceso de planificacin.

    El anlisis estadstico no es un segundo paso independiente de la tarea deplanificacin. Es necesario comprender la totalidad de objetivos propuestosantes de comenzar con el anlisis. Si no se hace as, tratar que elexperimento responda a otras cuestiones a posteriori puede ser (lo ser casisiempre) imposible.

    Pero no slo los objetivos estn presentes al inicio del anlisis sino tambin latcnica experimental empleada. Una regla de oro en la experimentacin y quedebe utilizarse es la siguiente:

    No invertir nunca todo el presupuesto en un primer conjunto deexperimentos y utilizar en su diseo toda la informacin previa disponible.

    Finalmente indicar que todas las personas que trabajan en el experimento sedeben implicar en el mismo, esto es:

  • 8/3/2019 introduccion_dde

    13/19

    Toda persona implicada en la ejecucin del experimento y en la recoleccinde los datos debe ser informada con precisin de la estrategia experimentaldiseada.

    2.4 Resumen de los principales conceptos.

    En esta seccin se hace un resumen de la terminologa comn utilizada en lateora de los modelos de diseo de experimentos:

    Unidad experimental: son los objetos, individuos, intervalos de espacio o tiempo

    sobre los que se experimenta.

    Variable de inters o respuesta: es la variable que se desea estudiar y controlar su

    variabilidad.

    Factor: son las variables independientes que pueden influir en la variabilidad de la

    variable de inters.

    Factor tratamiento: es un factor del que interesa conocer su influencia en la

    respuesta.

    Factor bloque: es un factor en el que no se est interesado en conocer su influencia

    en la respuesta pero se supone que sta existe y se quiere controlar para disminuir la

    variabilidad residual.

    Niveles: cada uno de los resultados de un factor. Segn sean elegidos por el

    experimentador o elegidos al azar de una amplia poblacin se denominan factores de

    efectos fijos o factores de efectos aleatorios.

    Tratamiento: es una combinacin especfica de los niveles de los factores en estudio.

    Son, por tanto, las condiciones experimentales que se desean comparar en el

    experimento. En un diseo con un nico factor son los distintos niveles del factor y en

    un diseo con varios factores son las distintas combinaciones de niveles de los

    factores.

    Observacin experimental: es cada medicin de la variable respuesta.

    Tamao del Experimento: es el nmero total de observaciones recogidas en el

    diseo.

    Interaccin de factores: existe interaccin entre dos factores FI y FJ si el efecto de

    algn nivel de FI cambia al cambiar de nivel en FJ. Esta definicin puede hacerse de

    forma simtrica y se puede generalizar a interacciones de orden tres o superior.

    Ortogonalidad de factores: dos factores FI y FJ con I yJ niveles, respectivamente, son

    ortogonales si en cada nivel i de FI el nmero de observaciones de los J niveles de FJ

    estn en las mismas proporciones. Esta propiedad permite separar los efectos simples

  • 8/3/2019 introduccion_dde

    14/19

    de los factores en estudio.

    Diseo equilibrado o balanceado: es el diseo en el que todos los tratamientos son

    asignados a un nmero igual de unidades experimentales.

    2.5 Principios bsicos en el diseo de experimentos.

    Al planificar un experimento hay tres tres principios bsicos que se deben tenersiempre en cuenta:

    El principio de aleatorizacin.

    El bloqueo.

    La factorizacin del diseo.

    Los dos primeros (aleatorizar y bloquear) son estrategias eficientes para asignarlos tratamientos a las unidades experimentales sin preocuparse de qutratamientos considerar. Por el contrario, la factorizacin del diseo define unaestrategia eficiente para elegir los tratamientos sin considerar en absoluto comoasignarlos despus a las unidades experimentales.

    Aleatorizar

    Aleatorizar todos los factores no controlados por el experimentador en el diseoexperimental y que pueden influir en los resultados sern asignados al azar a lasunidades experimentales.

    Ventajas de aleatorizar los factores no controlados:

    Transforma la variabilidad sistemtica no planificada en variabilidad noplanificada o ruido aleatorio. Dicho de otra forma, aleatorizar previenecontra la introduccin de sesgos en el experimento.

    Evita la dependencia entre observaciones al aleatorizar los instantes derecogida muestral.

    Valida muchos de los procedimientos estadsticos ms comunes.Bloquear

    Se deben dividir o particionar las unidades experimentales en grupos llamadosbloques de modo que las observaciones realizadas en cada bloque se realicenbajo condiciones experimentales lo ms parecidas posibles. A diferencia de loque ocurre con los factores tratamiento, el experimentador no est interesadoen investigar las posibles diferencias de la respuesta entre los niveles de losfactores bloque.

  • 8/3/2019 introduccion_dde

    15/19

    Bloquear es una buena estrategia siempre y cuando sea posible dividir lasunidades experimentales en grupos de unidades similares.

    La ventaja de bloquear un factor que se supone que tienen una clara influenciaen la respuesta pero en el que no se est interesado, consiste en convertir la

    variabilidad sistemtica no planificada en variabilidad sistemtica planificada.

    Con el siguiente ejemplo se trata de indicar la diferencia entre las estrategias dealeatorizar y de bloquear en un experimento.

    Ejemplo 2.1.

    Se desea investigar las posibles diferencias en la produccin de dos mquinas,cada una de las cuales debe ser manejada por un operario.

    En el planteamiento de este problema la variable respuesta es la produccin de

    una mquina(en un da), el factor-tratamiento en el que se est interesado esel tipo de mquina que tiene dos niveles y un factor nuisance es el operarioque maneja la mquina. En el diseo del experimento para realizar el estudiose pueden utilizar dos estrategias para controlar el factor operario que manejala mquina.

    Aleatorizar: se seleccionan al azar dos grupos de operarios y se asigna al azarcada grupo de operarios a cada una de las dos mquinas. Finalmente se evala laproduccin de las mismas.

    Bloquear: se introduce el factor-bloque operario. Se elige un nico grupo de

    operarios y todos ellos utilizan las dos mquinas.

    Qu consideraciones se deben tener en cuenta al utilizar estas dos estrategias?Qu estrategia es mejor?

    La factorizacin del diseo.

    Un diseo factorial es una estrategia experimental que consiste en cruzar losniveles de todos los factores tratamiento en todas las combinaciones posibles.

    Ventajas de utilizar los diseos factoriales:

    Permiten detectar la existencia de efectos interaccin entre losdiferentes factores tratamiento.

    Es una estrategia ms eficiente que la estrategia clsica de examinar lainfluencia de un factor manteniendo constantes el resto de losfactores.

    2.6 Algunos diseos experimentales clsicos.

  • 8/3/2019 introduccion_dde

    16/19

    Un diseo experimental es una regla que determina la asignacin de las unidadesexperimentales a los tratamientos. Aunque los experimentos difieren unos deotros en muchos aspectos, existen diseos estndar que se utilizan con muchafrecuencia. Algunos de los ms utilizados son los siguientes:

    2.6.1 Diseo completamente aleatorizado.

    El experimentador asigna las unidades experimentales a los tratamientos al azar.La nica restriccin es el nmero de observaciones que se toman en cadatratamiento. De hecho si ni es el nmero de observaciones en el i-simotratamiento, i = 1,...,I, entonces, los valores n1,n2,...,nIdeterminan por completolas propiedades estadsticas del diseo. Naturalmente, este tipo de diseo seutiliza en experimentos que no incluyen factores bloque.

    El modelo matemtico de este diseo tiene la forma:

    2.6.2 Diseo en bloques o con un factor bloque.

    En este diseo el experimentador agrupa las unidades experimentales enbloques, a continuacin determina la distribucin de los tratamientos en cadabloque y, por ltimo, asigna al azar las unidades experimentales a lostratamientos dentro de cada bloque.

    En el anlisis estadstico de un diseo en bloques, stos se tratan como losniveles de un nico factor de bloqueo, aunque en realidad puedan venir definidos

    por la combinacin de niveles de ms de un factor nuisance.

    El modelo matemtico de este diseo es:

    El diseo en bloques ms simple es el denominado diseo en bloques completos,en el que cada tratamiento se observa el mismo nmero de veces en cadabloque.

    El diseo en bloques completos con una nica observacin por cada tratamiento

    se denomina diseo en bloques completamente aleatorizado o, simplemente,diseo en bloquesaleatorizado.

    Cuando el tamao del bloque es inferior al nmero de tratamientos no es posibleobservar la totalidad de tratamientos en cada bloque y se habla entonces dediseo en bloquesincompletos.

  • 8/3/2019 introduccion_dde

    17/19

    2.6.3 Diseos con dos o ms factores bloque.

    En ocasiones hay dos (o ms) fuentes de variacin lo suficientementeimportantes como para ser designadas factores de bloqueo. En tal caso, ambosfactores bloque pueden ser cruzados o anidados.

    Los factores bloque estn cruzados cuando existen unidades experimentales entodas las combinaciones posibles de los niveles de los factores bloques.

    Diseo con factores bloque cruzados. Tambin denominado diseo fila-columna, se caracteriza porque existen unidades experimentales en todas lasceldas (intersecciones de fila y columna).

    El modelo matemtico de este diseo es:

    Los factores bloque estn anidados si cada nivel particular de uno de los factoresbloque ocurre en un nico nivel del otro factor bloque.

    Diseo con factores bloque anidados o jerarquizados. Dos factores bloque sedicen anidados cuando observaciones pertenecientes a dos niveles distintos de unfactor bloque estn automticamente en dos niveles distintos del segundo factorbloque.

    En la siguiente tabla puede observarse la diferencia entre ambos tipos debloqueo.

    Bloques Cruzados Bloques Anidados

    Bloque 1 Bloque 1

    1 2 3 1 2 3

    1* * *

    1*

    Bloqu

    e 2

    2 * * * 2 *

    3 * * * 3 *

    Bloqu 4 *

  • 8/3/2019 introduccion_dde

    18/19

    e 2

    5 *

    6 *

    7 *

    8 *

    9 *

    Tabla 2.1: Plan esquemtico de experimentos con dos factores bloque

    2.6.4 Diseos con dos o ms factores.

    En algunas ocasiones se est interesado en estudiar la influencia de dos (o ms)factores tratamiento, para ello se hace un diseo de filas por columnas. En estemodelo es importante estudiar la posible interaccin entre los dos factores. Si encada casilla se tiene una nica observacin no es posible estudiar la interaccinentre los dos factores, para hacerlo hay que replicar el modelo, esto es, obtenerkobservaciones en cada casilla, donde kes el nmero de rplicas.

    El modelo matemtico de este diseo es:

    Respuesta = Constante + Efecto factor fila + Efecto factor columna +

    Efecto interaccin + Error

    Generalizar los diseos completos a ms de dos factores es relativamentesencillo desde un punto de vista matemtico, pero en su aspecto prctico tieneel inconveniente de que al aumentar el nmero de factores aumenta muyrpidamente el nmero de observaciones necesario para estimar el modelo. En laprctica es muy raro utilizar diseos completos con ms de factores.

    Un camino alternativo es utilizar fracciones factoriales que son diseos en losque se supone que muchas de las interacciones son nulas, esto permite estudiar

    el efecto de un nmero elevado de factores con un nmero relativamentepequeo de pruebas. Por ejemplo, el diseo en cuadrado latino, en el que sesupone que todas las interacciones son nulas, permite estudiar tres factores de kniveles con solo k2 observaciones. Si se utilizase el diseo equilibrado completose necesitan k3 observaciones.

  • 8/3/2019 introduccion_dde

    19/19

    2.6.5 Diseos factoriales a dos niveles.

    En el estudio sobre la mejora de procesos industriales (control de calidad) esusual trabajar en problemas en los que hay muchos factores que pueden influiren la variable de inters. La utilizacin de experimentos completos en estos

    problemas tiene el gran inconveniente de necesitar un nmero elevado deobservaciones, adems puede ser una estrategia ineficaz porque, por lo general,muchos de los factores en estudio no son influyentes y mucha informacinrecogida no es relevante. En este caso una estrategia mejor es utilizar unatcnica secuencial donde se comienza por trabajar con unos pocos factores ysegn los resultados que se obtienen se eligen los factores a estudiar en lasegunda etapa.

    Los diseos factoriales 2k son diseos en los que se trabaja con k factores, todosellos con dos niveles (se suelen denotar + y-). Estos diseos son adecuados paratratar el tipo de problemas descritos porque permiten trabajar con un nmero

    elevado de factores y son vlidos para estrategias secuenciales.

    Si k es grande, el nmero de observaciones que necesita un diseo factorial 2k esmuy grande (n = 2k). Por este motivo, las fracciones factoriales 2k-p son muyutilizadas, stas son diseos con k factores a dos niveles, que mantienen lapropiedad de ortogonalidad de los factores y donde se suponen nulas lasinteracciones de orden alto (se confunden con los efectos simples) por lo quepara su estudio solo se necesitan 2k-pobservaciones (cuanto mayor seap menornmero de observaciones se necesita pero mayor confusin de efectos sesupone).

    En los ltimos aos Taguchi ha propuesto la utilizacin de fracciones factorialescon factores a tres niveles en problemas de control de calidad industrial.

    http://www.udc.es/dep/mate/estadistica2/cap2.html

    http://www.udc.es/dep/mate/estadistica2/cap2.htmlhttp://www.udc.es/dep/mate/estadistica2/cap2.htmlhttp://www.udc.es/dep/mate/estadistica2/cap2.html