2.1 Introducción.

Los modelos de “Diseño de experimentos” son modelos estadísticos clásicos cuyo objetivo es averiguar si unos determinados factores influyen en la variable de interés y, si existe influencia de algún factor, cuantificarla. Ejemplos donde habría que utilizar estos modelos son los siguientes:

bulletEn el rendimiento de un determinado tipo de máquinas (unidades producidas por día) se desea estudiar la influencia del trabajador que la maneja y la marca de la máquina.
bulletSe quiere estudiar la influencia del tipo de pila eléctrica y de la marca en la duración de las pilas.
bulletUna compañía telefónica está interesada en conocer la influencia de varios factores en la variable de interés  “la duración de una llamada telefónica”. Los factores que se consideran son los siguientes: hora a la que se produce la llamada; día de la semana en que se realiza la llamada; zona de la ciudad desde la que se hace la llamada; sexo del que realiza la llamada; tipo de teléfono (público o privado) desde el que se realiza la llamada.
bulletUna compañía de software está interesada en estudiar la variable “porcentaje que se comprime un fichero al utilizar un programa que comprime ficheros” teniendo en cuenta el tipo de programa utilizado y el tipo de fichero que se comprime.
bulletSe quiere estudiar el rendimiento de los alumnos en una asignatura y, para ello, se desean controlar diferentes factores: profesor que imparte la asignatura; método de enseñanza; sexo del alumno.

La metodología del diseño de experimentos se basa en la experimentación. Es conocido que si se repite un experimento, en condiciones indistinguibles, los resultados presentan variabilidad que puede ser grande o pequeña. Si la experimentación se realiza en un laboratorio donde la mayoría de las causas de variabilidad están muy controladas, el error experimental será pequeño y habrá poca variación en los resultados del experimento. Pero si se experimenta en procesos industriales, administrativos, ...  la variabilidad es grande en la mayoría de los casos.

El objetivo del diseño de experimentos es estudiar si utilizar un determinado tratamiento produce una mejora en el proceso o no. Para ello se debe experimentar utilizando el tratamiento y no utilizándolo. Si la variabilidad experimental es grande, sólo se detectará la influencia del uso del tratamiento cuando éste produzca grandes cambios en relación con el error de observación.

La metodología del Diseño de Experimentos estudia cómo variar las condiciones habituales de realización de un proceso empírico para aumentar la probabilidad de detectar cambios significativos en la respuesta, de esta forma se obtiene un mayor conocimiento del comportamiento del proceso de interés.

Para que la metodología de diseño de experimentos sea eficaz es fundamental que el experimento esté bien diseñado.

Un experimento se realiza por alguno de los siguientes motivos:

* Determinar las principales causas de variación en la respuesta.

* Encontrar las condiciones experimentales con las que se consigue un valor extremo en la variable de interés o respuesta.

* Comparar las respuestas en diferentes niveles de observación de variables controladas.

* Obtener un modelo estadístico-matemático que permita hacer predicciones de respuestas futuras.

La utilización de los modelos de diseño de experimentos se basa en la experimentación y en el análisis de los resultados que se obtienen en un experimento bien planificado. En muy pocas ocasiones es posible utilizar estos métodos a partir de datos disponibles o datos históricos, aunque también se puede aprender de los estudios realizados a partir de datos recogidos por observación, de forma aleatoria y no planificada. En el análisis estadístico de datos históricos se pueden cometer diferentes errores,  los más comunes son los siguientes:

 
— Inconsistencia de los datos. Los procesos cambian con el tiempo, se producen cambios en el personal (cambios de personas, mejoras del personal por procesos de aprendizaje, motivación, ...),  cambios en las máquinas (reposiciones, reparaciones, envejecimiento, ...). Estos cambios tienen influencia en los datos recogidos, lo que hace que los datos históricos sean poco fiables, sobre todo si se han recogido en un amplio espacio de tiempo.
 
— Variables con fuerte correlación. Puede ocurrir que en el proceso existan dos o más variables altamente correlacionadas que pueden llevar a situaciones confusas. Por ejemplo, en el proceso hay dos variables X1 y X2 fuertemente correlacionadas que influyen en la respuesta, pero si en los datos que se tiene aumenta al mismo tiempo el valor de las dos variables no es posible distinguir si la influencia es debida a una u otra o a ambas variables (confusión de los efectos). Otra situación problemática se presenta si solo se dispone de datos de una variable (por ejemplo de X1 y no de X2), lo que puede llevar a pensar que la variable influyente es la X1 cuando, en realidad, la variable influyente es la X2 (variable oculta).
 
— El rango de las variables controladas es limitado. Si el rango de una de las variables importantes e influyentes en el proceso es pequeño, no se puede saber su influencia fuera de ese rango y puede quedar oculta su relación con la variable de interés o lo cambios que se producen en la relación fuera del rango observado. Esto suele ocurrir cuando se utilizan los datos recogidos al trabajar el proceso en condiciones normales y no se experimenta (cambiando las condiciones de funcionamiento) para observar el comportamiento del proceso en situaciones nuevas.