5.6 Fracciones factoriales. El cuadrado latino.

Los modelos de diseño de experimentos expuestos en las secciones previas son diseños completos o equilibrados. En estos diseños se obtienen pruebas cruzando los niveles de los factores de todas las formas posibles, por ello, en estos diseños los factores son ortogonales.

El concepto de ortogonalidad de factores.

En un diseño de experimentos los factores Ta, con I niveles, y Tb, con J niveles, son ortogonales si en las pruebas del diseño en cada uno de los niveles i del factor Ta aparecen en idénticas proporciones los J niveles del factor Tb.

La propiedad de ortogonalidad permite separar los efectos de cada uno de los factores sobre la variable de interés.

Si los efectos simples de todos los factores estudiados en el diseño de experimentos son ortogonales, la estimación (^a )
  i del efecto del nivel i del factor Ta se obtiene como la diferencia entre la media de los resultados obtenidos cuando el factor Ta está al nivel i y la media general de todos los resultados.

^ai = yi.- y..

Las estimaciones así obtenidas para los efectos de un factor no están afectadas por los efectos de los otros factores, lo que permite separar los efectos simples de todos los factores estudiados.

En los diseños equilibrados el número de pruebas que hay que realizar crece muy rapidamente con el número de factores, aún en el caso de que se supongan nulas las interacciones y no sea necesario replicar el diseño. En estas situaciones son de gran utilidad los diseños de experimentos denominados fracciones factoriales, que permitan estudiar la influencia de los factores sin necesidad de realizar todas las pruebas pero manteniendo la propiedad de ortogonalidad de los efectos a estudiar. Como ejemplo de este tipo de modelos se expone a continuación la fracción factorial denominada cuadrado latino.

 

5.6.1 El modelo de cuadrado latino.

En un diseño de experimentos completo de tres factores, todos ellos con K niveles, necesita K3 observaciones, número elevado si K es grande. Un diseño más eficaz que solo utiliza K2 observaciones para el mismo problema es el cuadrado latino. Este modelo se basa en aprovechar la simetría del experimento factorial seleccionando un conjunto de condiciones experimentales con la condición de que cada nivel de un factor aparezca una vez con cada uno de los niveles de los otros factores. Por tanto, el diseño de cuadrado latino se puede utilizar si se verifican las siguientes condiciones:

  1. Es un diseño de experimentos con tres factores.
  2. Los tres factores tienen el mismo número de niveles: K.
  3. No hay interacciones entre los tres factores.

El diseño en cuadrado latino está especialmente indicado para estudiar un factor-tratamiento con K niveles y con dos factores-bloque de K  bloques cada uno. Este diseño se basa en el concepto de cuadrado latino que es el siguiente

“Un cuadrado latino K × K es una disposición de K  letras en una matriz  K × K  de forma que todas las letras aparecen una vez en cada fila y una vez en cada columna.

Por ejemplo, un cuadrado latino 3 × 3 es el siguiente

A B C
B C A
C A B

 Tabla 5.5. Cuadrado latino 3 × 3.

Un cuadrado latino es un cuadrado latino estándar cuando las letras de la primera fila y de la primera columna están dispuestas en orden alfabético.

Un cuadrado latino es un cuadrado latino cíclico si las letras de cada fila se generan cíclicamente de la anterior según el orden alfabético.

El cuadrado latino 3 × 3 de la Tabla 5.5 es estándar y cíclico.

Existe un único cuadrado latino 3 × 3 estándar, sin embargo hay cuatro cuadrados latinos 4 × 4 estándar que se presentan en la Tabla 5.6.

Cuadro 1

 

Cuadro 2

 

Cuadro 3

 

Cuadro 4
A B C D

 

A B C D

 

A B C D

 

A B C D
B C D A

 

B A D C

 

B A D C

 

B D A C
C D A B

 

C D A B

 

C D B A

 

C A D B
D A B C

 

D C B A

 

D C A B

 

D C B A

Tabla 5.6: Cuatro posibles cuadrados latinos 4 × 4 estándar.

“Un diseño en cuadrado latino es un diseño de un factor tratamiento con K  niveles y K2 unidades experimentales agrupadas en K bloques fila y K bloques columna, de forma que unidades experimentales de un mismo bloque fila son semejantes, unidades experimentales de un mismo bloque columna son semejantes y unidades experimentales de distintos bloques fila y distintos bloques columna son sustancialmente diferentes”.

Para cualquier número de tratamientos K existe siempre al menos un diseño en cuadrado latino estándar cíclico.

Obsérvese que si en un diseño en cuadrado latino se ignora el bloque columna se tiene un diseño en bloques completamente aleatorizado (el bloque fila es el factor bloque) y, análogamente, si se ignora el bloque fila se tiene un diseño en bloques completamente aleatorizado (el bloque columna es el factor bloque). Además se trata de un diseño equirreplicado: cada tratamiento aparece un mismo número K de veces en el diseño.

Modelo matemático.

Se tiene un diseño en cuadrado latino de dos factores bloque y un factor tratamiento, el primer factor bloque se denota por Ba y se coloca en filas, el segundo factor bloque se denota por Bb y se coloca en columnas, el factor tratamiento se denota por Tg y sus niveles se colocan según el cuadrado latino. Por tanto, el cuadrado latino condiciona el nivel de Tg que se utiliza en la casilla ij (bloque i de Ba y bloque j de Bb) y este nivel no se elige.

La formulación matemática del modelo es la siguiente:

para cada i = 1,...,K, j = 1,...,K, (el índice k  (- {1,...,K} lo impone el diseño en cuadrado latino) se tiene

 

             --determinista--
 Yij(k)  =   m + ai + bj+gk +   eij(k)                                (1.35)
  - -                           - -
aleatorio                       aleatorio                    (    )
            con eij(k) v.a. independientes con distribución N 0,s2 ,

donde,

* Y ij(k) es el resultado del bloque i-ésimo, i = 1,...,K del factor bloque Ba y del bloque j-ésimo, j = 1,...,J del factor-bloque Bb, y del nivel k-ésimo del factor Tg. Se denota la k entre paréntesis, para indicar que este índice no se elige sino que viene condicionado por el par ij.

* m es el efecto global que mide el nivel medio de todos los resultados,

* ai es el efecto (positivo o negativo) sobre la media global debido al bloque i de Ba . Se verifica que  sum i = 1Iai = 0,

* bj es el efecto (positivo o negativo) sobre la media global debido al bloque j de Bb. Se verifica que  sum j = 1Jbj = 0,

* gk es el efecto (positivo o negativo) sobre la media global debido al nivel k del factor Fg. Se verifica que  sum k = 1Kgk = 0,

* eij(k) es el error experimental, son variables aleatorias i.i.d. con distribución N(0,s2).

Estimación de los parámetros.

La técnica de mínimos cuadrados proporciona los siguientes estimadores:

 

            -1- K sum    sum K
 ^m  =  y..= K2        yij(k)
                i=1 j=1
                                          1  sum K
^ai  =  yi.- y..,  i = 1,...,K,   con  yi.= K-    yij(k),
                                            j=1
                                          1  K sum 
^bj  =  y.j- y..,  j = 1,...,K,  con   y.j = --    yij(k),
                                          K  i=1
                                              1  sum K K sum 
^gk  =  y..(k)- y..,  k = 1,...,K,   con   y..(k) = --       yij(k)
                                              K i=1j=1

Los residuos son

eij(k)  =  yij(k) - ^yij(k)
      =  yij(k) - (m^+ ^ai + ^bj + g^k), i,j,k = 1,...,K
que verifican las siguientes restricciones
   K sum 
      eij(k) =   0,  con  j = 1,...,K,
   i=1
   K sum 
      eij(k) =   0,  con  i = 1,...,K,
   j=1
K  K
 sum   sum  e     =   0,  con  k = 1,...,K,
i=1 j=1 ij(k)
en total hay 3K - 2 restricciones, y los residuos tienen K2 - (3K - 2) = (K - 1)(K  - 2) grados de libertad.

Tabla ANOVA.

De la descomposición de la variabilidad se obtiene la tabla ANOVA (Tabla 5.7.) de donde se deducen los siguientes contrastes:  

 
[1] Si la hipótesis nula H0(g) : g1 = g2 = ... = gK = 0, (el factor Fg no influye, el más importante porque es el factor-tratamiento en el que se está interesado) es cierta, se verifica que

SCM   Tg     2            SCM  T g
---s2--- ~ x (K -1) ==> Fg = -SCM--R- ~ F(K -1),(K -1)(K -2)
(1.36)

se rechaza H0(g) al nivel de significación a si ^
Fg = scmTg scmR > ^
F(K -1),(K-1)(K -2)(1- a).

 
[2] Aunque de menor interés también se pueden hacer contrastes acerca de la influencia de los bloques fila y columna para saber si ha sido conveniente bloquear o no.

Si la hipótesis nula H0(a) : a1 = a2 = ... = aK = 0, (el bloque fila no influye) es cierta, se verifica que

SCM---Ba- ~ x2     ==> F  =  SCM--Ba--~ F               ,
   s2        (K-1)     a   SCM   R     (K- 1),(K -1)(K- 2)
(1.37)
se rechaza H0(a) al nivel de significación a si ^Fa = scmBa scmR > F^(K-1),(K- 1)(K- 2)(1 - a).
 
[3] Si la hipótesis nula H0(b) : b1 = b2 = ... = bK = 0, (el factor columna no influye) es cierta, se verifica que

SCM   Bb                   SCM  Bb
-----2--- ~ x2(K-1) ==> Fb =  ---------~ F(K- 1),(K -1)(K- 2),
    s                      SCM   R
(1.38)
se rechaza H0(b) al nivel de significación a si ^Fb = scmBb scmR > F^(K-1),(K- 1)(K-2)(1 - a).
CUADRO DEL ANÁLISIS DE LA VARIANZA
— MODELO CUADRADO LATINO —
Fuente de
Variación
Suma de
Cuadrados
g.l.

 

scm

 

F^

 

Bloques
(Ba)
 
scBF =
K sum i2
K - 1
scmBa =
scBF--
K - 1
F^  a =
(scmBa) / (scmR)
Bloques
(Bb)
scBC =
K sum j j2
K - 1
scmBb =
scBC--
K - 1
F^  a =
(scmBa) / (scmR)
Factor T
(Tg)
scTL =
K  sum k 2
K - 1
scmTg =
 scTL
------
K  - 1
F^  a =
(scmBa) / (scmR)
Residual
scR =
 sum i  sum j eij(k)2
(K-1)(K-2)
scmR =
      scR
(K----1)(K----2)
-----scR-------
(K - 1)(K - 2)
Global
scG =
 sum i  sum j (       -- )
 yij(k)- y...2
K2 - 1
scmG =
  scG
K2----1
 
Rechazar H0(a) : a1 = a2 = ... = ak, según p = P(F^  a <(                     )
  scmA--> F
  scmR      I- 1,IJ(K -1))

Rechazar H0(a) : b1 = b2 = ... = bK, según p = P(F^  a <(                     )
  scmA--> F
  scmR      I- 1,IJ(K -1))

Rechazar H0(a) : g1 = g2 = ... = gK, según p = P(F^  a <(                     )
  scmA--> F
  scmR      I- 1,IJ(K -1))

Tabla 5.6. Cuadro del análisis de la varianza para un diseño de cuadrado latino.

Extensiones de los modelos de diseños experimentales.

Siguiendo la metodología expuesta en los diseños estudiados es fácil generalizar el diseño de cuadrado latino y tienen interés los siguientes modelos:

 
Cuadrado latino replicado. Si se replica el modelo del cuadrado latino, aún manteniendo las mismas condiciones de experimentación, es posible que exista cierta heterogeneidad entre las réplicas por lo que es conveniente considerar las réplicas como bloques. El modelo matemático de este diseño es:
y     = m + a + b  + g  + d + +u
 ij(k)r        i    j   k    r     ij(k)r
y     = m + a + b  + g  + d + +u
 ij(k)r        i    j   k    r     ij(k)r
(k)r

donde dr (r = 1,...,R)  es el efecto réplica que se estimará por la diferencia entre la media de cada réplica completa y la media general.

 
Cuadrado greco-latino. Si se aumenta el número de factores-bloque, la extensión del cuadrado latino es el greco-latino, que permite con K2 observaciones estudiar cuatro factores de K niveles sin interacciones (un factor-tratamiento y tres factores bloque), si se utilizase el diseño completo es necesario utilizar K4 observaciones. En el diseño en cuadrado greco-latino se superponen dos cuadrados latinos, resultando el siguiente modelo matemático:
yij(kh) = m+  ai + bj + gk + dh + eij(kh)

El inconveniente de este modelo es que su utilización es muy restrictiva. Además pueden no existir cuadrados latinos de determinadas condiciones.

5.6.2 Análisis de un caso

 En este apartado se desarrolla un problema de diseño de experimentos de cuadrado latino. El enunciado del problema es el siguiente:

Ejemplo 5.4.

“Se quiere estudiar la posible influencia de los “aditivos de combustible” (factor tratamiento, Tg) en la “reducción de óxidos de nitrógeno en las emisiones de los automóviles” (variable respuesta) controlando la influencia del “conductor” (factor-bloque Ba) y del  “tipo de coche” (factor-bloque, Bb).

Se consideran cuatro conductores: C1, C2, C3, C4. (efecto a)

Cuatro tipos de coche: Seat, Ford, Opel, Renault. (efecto b)

Cuatro aditivos de combustible: A1, A2, A3, A4. (efecto g)

Los resultados del experimento diseñado según la técnica del cuadrado latino son los de la tabla adjunta, también se presenta el cuadrado latino utilizado. ¿Qué conclusiones se deducen del experimento?”











Seat Ford Opel Renault





C1 21 A1 26 A2 20 A4 25 A3





C2 23 A4 26 A3 20 A1 27 A2





C3 15 A2 13 A4 16 A3 16 A1





C4 17 A3 15 A1 20 A2 20 A4









C. Latino




1 2 4 3




4 3 1 2




2 4 3 1




3 1 2 4




Solución.

Estimación de los parámetros. Se obtienen los siguientes estimadores:

Estimaciones







y i y.·i j y..k






23 3 19 -1 18 -2






24 4 20 0 22 2






15 -5 19 -1 21 1






18 -2 22 2 19 -1

y.. = y= 20







Los residuos del modelo son:

Residuos






Seat Ford Opel Renault





C1 1 A1 1 A2 -1 A4 -1 A3





C2 1 A4 1 A3 -1 A1 -1 A2





C3 -1 A2 -1 A4 1 A3 1 A1





C4 -1 A3 -1 A1 1 A2 1 A4





 Tabla ANOVA. Utilizando las estimaciones y residuos obtenidos se obtiene la siguiente tabla ANOVA

Tabla ANOVA







Fuentes de Suma de Grados de Varianza F^ p - valor
variación cuadrados libertad






Factor conductor
216
3
72
27
0'0007






Factor coche
24
3
8
3
0'1117






Factor aditivo
40
3
13'33
5
0'0452






Variab. Explicada
280
9






Residual
16
6
2'66






Global
296
15
19'73






De esta tabla se deducen los siguientes contrastes:
 
[1] El contraste de la hipótesis: “el factor g (aditivo) no influye”. Se realiza por el estadístico
F^g =  -40--= 13'33gF3,9 ==> pg - valor = 0'0452,
      2'667

se tienen dudas acerca de si aceptar o no esta hipótesis ya que su p-valor<= 0'05. Es el contraste más interesante ya que se contrasta la posible influencia del factor tratamiento en el que se está interesado.

 
[2] El contraste de la hipótesis: “el factor a (conductor) no influye”.
^    --72-                            '
Fa = 2'667 = 27 ~ F3,9 ==>  pa- valor = 00007,

se rechaza esta hipótesis de no influencia del factor “conductor”.

 
[3] El contraste de la hipótesis: “el factor b (coche) no influye”.
 ^    -24--                          '
Fb =  2'667 = 8 ~ F3,9 ==> pb - valor = 0 1170,

se acepta, a un nivel inferior razonable (< 0'11) la no influencia del factor “coche”.

Los coeficientes de determinación de los tres factores son:

R2 (“aditivo”) = -40-= 0'1351,
                296

  2               216-    '
R  (“conductor”) = 296 =  07297,

  2            24--   '
R  (“coche”) = 296 = 00811,

  2           280-   '
R  (“total”) = 296 = 0 9459.

De los contrastes anteriores se deduce que ha sido conveniente bloquear  el tipo de “conductor” pero no conviene bloquear  el tipo de “coche”. Se puede eliminar el factor “coche”, basta con sumar la fila correspondiente al factor “coche” con la fila de la variabilidad residual, aunque se pueden hacer críticas al diseño resultante. Se obtiene la siguiente tabla ANOVA

Tabla ANOVA 2







Fuentes de Suma de. Grados Varianza ^F p - valor
Variación Cuadrados libertad






Factor conductor
216
3
72'00
16'20
0'0006






Factor aditivo
40
3
13'33
3'00
0'0877






Variab. Exp. Total
256
6






Residual
40
9
4'44






Global
296
15
19'73






Trabajando con un nivel de significación de a = 0'05 se acepta la no influencia del factor tratamiento “tipo de aditivo”.