2.3 Planificación de un experimento.

La experimentación forma parte natural de la mayoría de las investigaciones científicas e industriales, en muchas de las cuales, los resultados del proceso de interés se ven afectados por la presencia de distintos factores, cuya influencia puede estar oculta por la variabilidad de los resultados muestrales. Es fundamental conocer los factores que influyen realmente y estimar esta influencia. Para conseguir ésto es necesario experimentar, variar las condiciones que afectan a las unidades experimentales y observar la variable respuesta. Del análisis y estudio de la información recogida se obtienen las conclusiones.

La forma tradicional que se utilizaba en la experimentación, para el estudio de estos problemas, se basaba en estudiar los factores uno a uno, ésto es, variar los niveles de un factor permaneciendo fijos los demás. Esta metodología presenta grandes inconvenientes:

* Es necesario un gran número de pruebas.

* Las conclusiones obtenidas en el estudio de cada factor tiene un campo de validez muy restringido.

* No es posible estudiar la existencia de interacción entre los factores.

* Es inviable, en muchos casos, por problemas de tiempo o costo.

Las técnicas de diseño de experimentos se basan en estudiar simultaneamente los efectos de todos los factores de interés, son más eficaces y proporcionan mejores resultados con un menor coste.

A continuación se enumeran las etapas que deben seguirse para una correcta planificación de un diseño experimental, etapas que deben ser ejecutadas de forma secuencial. También se introducen algunos conceptos básicos en el estudio de los modelos de diseño de experimentos.

Las etapas a seguir en el desarrollo de un problema de diseño de experimentos son las siguientes:

  1. Definir los objetivos del experimento.
  2. Identificar todas las posibles fuentes de variación, incluyendo:

      — factores tratamiento y sus niveles,

      — unidades experimentales,

      — factores nuisance (molestos): factores bloque, factores ruido y covariables.

  3. Elegir una regla de asignación de las unidades experimentales a las condiciones de estudio (tratamientos).
  4. Especificar las medidas con que se trabajará (la respuesta), el procedimiento experimental y anticiparse a las posibles dificultades.
  5. Ejecutar un experimento piloto.
  6. Especificar el modelo.
  7. Esquematizar los pasos del análisis.
  8. Determinar el tamaño muestral.
  9. Revisar las decisiones anteriores. Modificarlas si se considera necesario.

Los pasos del listado anterior no son independientes y en un determinado momento puede ser necesario volver atrás y modificar decisiones tomadas en algún paso previo.

A continuación se hace una breve descripción de las decisiones que hay que tomar en cada uno de los pasos enumerados. Sólo después de haber tomado estas decisiones se procederá a realizar el experimento.

1.- Definir los objetivos del experimento.

Se debe hacer una lista completa de las preguntas concretas a las que debe dar respuesta el experimento. Es importante indicar solamente cuestiones fundamentales ya que tratar de abordar problemas colaterales pueden complicar innecesariamente el experimento.

Una vez elaborada la lista de objetivos, puede ser útil esquematizar el tipo de conclusiones que se espera obtener en el posterior análisis de datos.

Normalmente la lista de objetivos es refinada a medida que se van ejecutando las etapas del diseño de experimentos.

 

2.- Identificar todas las posibles fuentes de variación.

Una fuente de variación es cualquier “cosa” que pueda generar variabilidad en la respuesta. Es recomendable hacer una lista de todas las posibles fuentes de variación del problema, distinguiendo aquellas que, a priori, generarán una mayor variabilidad. Se distinguen dos tipos:

- Factores tratamiento: son aquellas fuentes cuyo efecto sobre la respuesta es de particular interés para el experimentador.

- Factores “nuisance”: son aquellas fuentes que no son de interés directo pero que se contemplan en el diseño para reducir la variabilidad no planificada.

A continuación se precisan más estos importantes conceptos.

(i) Factores y sus niveles.

Se denomina factor tratamiento  a cualquier variable de interés para el experimentador cuyo posible efecto sobre la respuesta se quiere estudiar.

Los niveles de un factor tratamiento son los tipos o grados específicos del factor que se tendrán en cuenta en la realización del experimento.

Los factores tratamiento pueden ser cualitativos o cuantitativos.

Ejemplos de factores cualitativos y sus niveles respectivos son los siguientes:

— proveedor (diferentes proveedores de una materia prima),

— tipo de máquina (diferentes tipos o marcas de máquinas),

— trabajador (los trabajadores encargados de hacer una tarea),

— tipo de procesador (los procesadores de los que se quiere comparar su velocidad de ejecución),

— un aditivo químico (diferentes tipos de aditivos químicos),

— el sexo (hombre y mujer),

— un método de enseñanza (un número determinado de métodos de enseñanza cuyos resultados se quieren comparar).

Ejemplos de factores cuantitativos son los siguientes:

— tamaño de memoria (diferentes tamaños de memoria de ordenadores),

— droga (distintas cantidades de la droga),

— la temperatura (conjuntos de temperaturas seleccionadas en unos rangos de interés).

Debe tenerse en cuenta que en el tratamiento matemático de los modelos de diseño de experimento los factores cuantitativos son tratados como cualitativos y sus niveles son elegidos equiespaciados o se codifican. Por lo general, un factor no suele tener más de cuatro niveles.

Cuando en un experimento se trabaja con más de un factor,  se denomina:

Tratamiento a cada una de las combinaciones de niveles de los distintos factores.

Observación es una medida en las condiciones determinadas por uno de los tratamientos.

Experimento factorial es el diseño de experimentos en que existen observaciones de todos los posibles tratamientos.

(ii) Unidades experimentales.

Son el material donde evaluar la variable respuesta y al que se le aplican los distintos niveles de los factores tratamiento.

Ejemplos de unidades experimentales son:

— en informática, ordenadores, páginas web, buscadores de internet,

— en agricultura, parcelas de tierra,

— en medicina, individuos humanos u animales,

— en industria, lotes de material, trabajadores, máquinas.

Cuando un experimento se ejecuta sobre un período de tiempo de modo que las observaciones se recogen secuencialmente en instantes de tiempo determinados, entonces los propios instantes de tiempo pueden considerarse unidades experimentales.

Es muy importante que las unidades experimentales sean representativas de la población sobre la que se han fijado los objetivos del estudio. Por ejemplo, si se utilizan los estudiantes universitarios de un país como unidades experimentales, las conclusiones del experimento no son extrapolables a toda la población adulta del país.

(iii) Factores “nuisance”: bloques, factores ruido y covariables.

En cualquier experimento, además de los factores tratamiento cuyo efecto sobre la respuesta se quiere evaluar, también influyen otros factores, de escaso interés en el estudio, pero cuya influencia sobre la respuesta puede aumentar significativamente la variabilidad no planificada. Con el fin de controlar esta influencia pueden incluirse en el diseño nuevos factores que, atendiendo a su naturaleza, pueden ser de diversos tipos.

Factor bloque. En algunos casos el factor nuisance puede ser fijado en distintos niveles, de modo que es posible controlar su efecto a esos niveles. Entonces la forma de actuar es mantener constante el nivel del factor para un grupo de unidades experimentales, se cambia a otro nivel para otro grupo y así sucesivamente. Estos factores se denominan factores de bloqueo (factores-bloque) y las unidades experimentales evaluadas en un mismo nivel del bloqueo se dice que pertenecen al mismo bloque. Incluso cuando el factor nuisance no es medible, a veces es posible agrupar las unidades experimentales en bloques de unidades similares: parcelas de tierra contiguas o períodos de tiempo próximos probablemente conduzcan a unidades experimentales más parecidas que parcelas o períodos distantes.

Desde un punto de vista matemático el tratamiento que se hace de los factores-bloque es el mismo que el de los factores-tratamiento en los que no hay interacción, pero su concepto dentro del modelo de diseño de experimentos es diferente. Un factor-tratamiento es un factor en el que se está interesado en conocer su influencia en la variable respuesta y un factor-bloque es un factor en el que no se está interesado en conocer su influencia pero se incorpora al diseño del experimento para disminuir la variabilidad residuas del modelo.

Covariable. Si el factor nuisance es una propiedad cuantitativa de las unidades experimentales que puede ser medida antes de realizar el experimento (el tamaño de un fichero informático, la presión sanguínea de un paciente en un experimento médico o la acidez de una parcela de tierra en un experimento agrícola). El factor se denomina covariable y juega un papel importante en el análisis estadístico.

Ruido. Si el experimentador está interesado en la variabilidad de la respuesta cuando se modifican las condiciones experimentales, entonces los factores nuisance son incluidos deliberadamente en el experimento y no se aisla su efecto por medio de bloques. Se habla entonces de factores ruido.

En resumen, las posibles fuentes de variación de un experimento son:

 



Fuente
Tipo


Debida a las condiciones de interés
(Factores tratamiento)
Planificada y sistemática


Debida al resto de condiciones controladas
(Factores “nuisance”)
Planificada y sistemática


Debida a condiciones no controladas
(error de medida, material experimental, ... )
No planificada, pero ¿sistemática?


3.- Elegir una regla de asignación de las unidades experimentales a las condiciones de estudio (“tratamientos”).

La regla de asignación o diseño experimental especifica que unidades experimentales se observarán bajo cada tratamiento. Hay diferentes posibilidades:

   — diseño factorial o no,

   — anidamiento,

   — asignación al azar en determinados niveles de observación,

   — el orden de asignación, etc.

En la práctica, existen una serie de diseños estándar que se utilizan en la mayoría de los casos.

 

4.- Especificar las medidas que se realizarán (la “respuesta”), el procedimiento experimental y anticiparse a las posibles dificultades.

Variable respuesta o variable de interés. Los datos que se recogen en un experimento son medidas de una variable denominada variable respuesta o variable de interés.

Es importante precisar de antemano cuál es la variable respuesta y en qué unidades se mide. Naturalmente, la respuesta está condicionada por los objetivos del experimento. Por ejemplo, si se desea detectar una diferencia de 0'05 gramos en la respuesta de dos tratamientos no es apropiado tomar medidas con una precisión próxima al gramo.

A menudo aparecen dificultades imprevistas en la toma de datos. Es conveniente anticiparse a estos imprevistos pensando detenidamente en los problemas que se pueden presentar o ejecutando un pequeño experimento piloto (etapa 5). Enumerar estos problemas permite en ocasiones descubrir nuevas fuentes de variación o simplificar el procedimiento experimental antes de comenzar.

También se debe especificar con claridad la forma en que se realizarán las mediciones: instrumentos de medida, tiempo en el que se harán las mediciones, etc.

 

5.- Ejecutar un experimento piloto.

Un experimento piloto es un experimento que utiliza un número pequeño de observaciones. El objetivo de su ejecución es ayudar a completar y chequear la lista de acciones a realizar. Las ventajas que proporciona la realización de un pequeño experimento piloto son las siguientes:

— permite practicar la técnica experimental elegida e identificar problemas no esperados en el proceso de recogida de datos,

— si el expeerimento piloto tiene un tamaño suficientemente grande puede ayudar a seleccionar un modelo adecuado al experimento principal,

— los errores experimentales observados en el experimento piloto pueden ayudar a calcular el número de observaciones que se precisan en el experimento principal.

 

6.- Especificar el modelo.

El modelo matemático especificado debe indicar la relación que se supone que existe entre la variable respuesta y las principales fuentes de variación identificadas en el paso 2. Es fundamental que el modelo elegido se ajuste a la realidad con la mayor precisión posible.

El modelo más habitual es el modelo lineal:

     sum k Y =    ai + e.
    i=1

En este modelo la respuesta viene dada por una combinación lineal de términos que representan las principales fuentes de variación planificada más un término residual debido a las fuentes de variación no planificada. Los modelos que se estudian en este texto se ajustan a esta forma general. El experimento piloto puede ayudar a comprobar si el modelo se ajusta razonablemente bien a la realidad.

Los modelos de diseño de experimentos, según sean los factores incluídos en el mismo, se pueden clasificar en: modelo de efectos fijos, modelo de efectos aleatorios y modelos mixtos. A continuación se precisan estas definiciones.

Factor de efectos fijos es un factor en el que los niveles han sido seleccionados por el experimentador. Es apropiado cuando el interés se centra en comparar el efecto sobre la respuesta de esos niveles específicos.

Ejemplo: un empresario está interesado en comparar el rendimiento de tres máquinas del mismo tipo que tiene en su empresa.

Factor de efectos aleatorios es un factor del que sólo se incluyen en el experimento una muestra aleatoria simple de todos los posibles niveles del mismo. Evidentemente se utilizan estos factores cuando tienen un número muy grande de niveles y no es razonable o posible trabajar con todos ellos. En este caso se está interesado en examinar la variabilidad de la respuesta debida a la población entera de niveles del factor.

Ejemplo: una cadena de hipermercados que tiene en plantilla 300 trabajadores de caja está interesada en estudiar la influencia del factor trabajador en la variable “tiempo en el cobro a un cliente”.

Modelo de efectos fijos es un modelo en el que todos los factores son factores de efectos fijos.

Modelo de efectos aleatorios es un modelo en el que todos los factores son factores de efectos aleatorios.

Modelo mixto es un modelo en el que hay factores de efectos fijos y factores de efectos aleatorios.

 

7.- Esquematizar los pasos del análisis estadístico.

El análisis estadístico a realizar depende de:

   — los objetivos indicados en el paso 1,

   — el diseño seleccionado en el paso 3,

   — el modelo asociado que se especificó en el paso 5.

Se deben esquematizar los pasos del análisis a realizar que deben incluir:

   — estimaciones que hay que calcular,

   — contrastes a realizar,

   — intervalos de confianza que se calcularán

   — diagnosis y crítica del grado de ajuste del modelo a la realidad.

 

8.- Determinar el tamaño muestral.

Calcular el número de observaciones que se deben tomar para alcanzar los objetivos del experimento.

Existen, dependiendo del modelo, algunas fórmulas para determinar este tamaño. Todas ellas sin embargo requieren el conocimiento del tamaño de la variabilidad no planificada (no sistemática y sistemática, si es el caso) y estimarlo a priori no es fácil, siendo aconsejable sobreestimarla. Normalmente se estima a partir del experimento piloto y en base a experiencias previas en trabajos con diseños experimentales semejantes.

 

9.- Revisar las decisiones anteriores. Modificar si es necesario.

De todas las etapas enumeradas, el proceso de recogida de datos suele ser la tarea que mayor tiempo consume, pero es importante realizar una planificación previa, detallando los pasos anteriores, lo que garantizará que los datos sean utilizados de la forma más eficiente posible.

Es fundamental tener en cuenta que

“Ningún método de análisis estadístico, por sofisticado que sea, permite extraer conclusiones correctas en un diseño de experimentos mal planificado”.

Recíprocamente, debe quedar claro que el análisis estadístico es una etapa más que está completamente integrado en el proceso de planificación.

“El análisis estadístico no es un segundo paso independiente de la tarea de planificación. Es necesario comprender la totalidad de objetivos propuestos antes de comenzar con el análisis. Si no se hace así, tratar que el experimento responda a otras cuestiones a posteriori puede ser (lo será casi siempre) imposible”.

Pero no sólo los objetivos están presentes al inicio del análisis sino también la técnica experimental empleada. Una regla de oro en la experimentación y que debe utilizarse es la siguiente:

“No invertir nunca todo el presupuesto en un primer conjunto de experimentos y utilizar en su diseño toda la información previa disponible”.

Finalmente indicar que todas las personas que trabajan en el experimento se deben implicar en el mismo, esto es:

“Toda persona implicada en la ejecución del experimento y en la recolección de los datos debe ser informada con precisión de la estrategia experimental diseñada”.