6.7  El contraste de linealidad.

Si para cada valor de la variable explicativa (X =
xi) se dispone de varios valores de la variable respuesta (algo normal en los modelos de regresión de diseño fijo) la muestra es de la siguiente forma {(xi,yi,j) : i =
1,...,k; j = 1,...,ni}, que se puede ordenar como en la tabla adjunta





X1 X2 ... Xk




Y11 Y21 ... Yk1
Y12 Y22 ... Yk2
.. . .. . .. . .. .
Y1n1 Y2n2 ... Yknk




El tamaño muestral es n1 + n2 + ... + nk = n, y para cada valor de X = xi, i = 1,2,...,k se puede calcular la media condicionada muestral de la variable respuesta:

      1 sum ni yi.= --    yij,  i
= 1,2,...k,
     ni j=1

lo que permite descomponer los residuos de la siguiente forma

eij = (yij- ^yi) = (yij- yi)+ (yi-
^yi),  i = 1,2,...k, j = 1,...,ni.

Un razonamiento análogo al realizado anteriormente permite descomponer la variabilidad no explicada como sigue,

 

          k  ni      k  ni
scR  =    sum   sum  e2 =  sum    sum  (y  - y^)2
         i=1j=1 ij  i=1j=1  ij   i

          sum k  sum ni       2   sum k n sum i         2
     =         (yij- yi.) +        (yi.- ^yi)
         i=1j=1            i=1 j=1
          sum k  sum ni       2   sum k           2
     =         (yij- yi.) +     ni(yi.- ^yi) .
         i=1j=1            i=1

 

Ahora la descomposición de la variabilidad total es la siguiente,

 

                             |_                 _|  [               ]
          sum k  sum ni       2     sum k  sum ni       2     sum k           2
scG   =         (yij- y..)  =  |_      (yij- ^yi)  _| +     ni(^yi.- y..)
         i |_ =1j=1              i=1j=1         _|      i=1
            sum k n sum i             sum k               [k sum               ]
      =   |_       (yij - yi.)2 +   ni(yi.- ^yi)2 _|  +    ni(^yi.- y..)2 =
           i=1 j=1             i=1                i=1
      =  scR + scE =  scR(1) + scR (2) + scE.
 

En base a esta igualdad se puede construir la siguiente tabla ANOVA, más completa que la anterior,  

Tabla ANOVA del modelo de regresión simple
Fuente de
Variación
Suma de
Cuadrados
Grados de 
Libertad
Varianzas
Recta

scE =  sum i = 1kni(^yi- y..)2

1 s^e2 = V-E-
  1
scR(1) 

scR(2) 

scR

scR(1) =  sum i = 1kni(yi.- ^yi)2 

scR(2) =  sum i = 1k sum j = 1ni(yij- yi.)2

 scR =  sum i = 1k sum j = 1ni(y - y^)
  ij   i2

k -

n -

n - 2

s^R,12 = scR (1)
-------
 k - 2  

^sR,22 = scR (2)
-------
 n - k  

 ^sR2 =  scR
-----
n - 2

Global Global  sum i = 1n(yi- y)2 n - 1 ^s Y 2 = -scG-
n - 1

A partir de esta tabla ANOVA se puede contrastar la hipótesis de que la función de regresión es lineal frente a la alternativa de que no es lineal, esto es,

H  : E (Y/X  = x) = a + a x   (la
funció n es lineal)
 0              i    0   1 i

frente a la alternativa

H1 :  E (Y/X = x) = m (x)  (no es
una función lineal)

Si H0 es cierto, las medias condicionadas estarán próximas a la recta de regresión: y i  ~~ ^y i, y la scR(1) =  sum i = 1kni(y -
^y)
  i   i2  ~~ 0. De nuevo esta medida tiene dimensiones y no es válida para utilizar como medida de discrepancia, para resolver el problema se compara con ^s R,22 y el cociente de ambas cantidades se utiliza como estadístico del contraste en estudio.

      2 ^F  = ^sR,1
 L   ^s2R,2

Bajo la hipótesis de normalidad y H0 (hipótesis de linealidad) se deduce que F^L  sigue una distribución Fk - 2, n - k  (Contraste de la F).

     ^s2R,1 ^FL = ^s2--~ Fk-2,n- k
bajo H0
      R,2

Este contraste de linealidad de la F es unilateral. Si el p-valor = P(              )
  Fk-2,n- k > F^L es grande (mayor que a) se acepta que la curva de regresión es lineal.