1.3 Contraste o test de hipótesis. Definiciones.

1.3.1 Definiciones básicas.

Un contraste o test de hipótesis es una técnica de Inferencia Estadística que permite comprobar si la información que proporciona una muestra observada concuerda (o no) con la hipótesis estadística formulada sobre el modelo de probabilidad en estudio y, por tanto, se puede aceptar (o no) la hipótesis formulada.

Una hipótesis estadística es cualquier conjetura sobre una o varias características de interés de un modelo de probabilidad.

Una hipótesis estadística puede ser:

bulletParamétrica: es una afirmación sobre los valores de los parámetros poblacionales desconocidos. Las hipótesis paramétricas se clasifican en
bulletSimple: si la hipótesis asigna valores únicos a los parámetros (s = 1'5, m = 10, mX = mY ,...).
bulletCompuesta: si la hipótesis asigna un rango de valores a los parámetros poblacionales desconocidos (s > 1'5, 5 < m < 10, mX < mY ,...).
bulletNo Paramétrica: es una afirmación sobre alguna característica estadística de la población en estudio. Por ejemplo, las observaciones son independientes, la distribución de la variable en estudio es normal, la distribución es simétrica,...

La hipótesis que se contrasta se denomina hipótesis nula y, normalmente, se denota por H0. Si se rechaza la hipótesis nula es porque se asume como correcta una hipótesis complementaria que se denomina hipótesis alternativa y se denota por H1.

1.3.2 Pasos a seguir en la realización de un contraste de hipótesis.

Al realizar cualquier contraste de hipótesis estadístico se deben seguir las siguientes etapas:

  1. Plantear el contraste de hipótesis, definiendo la hipótesis nula (H0, hipótesis que se desea contrastar),  y la hipótesis alternativa (H1, cualquier forma de negación de la hipótesis nula ).
  2. Definir una medida de discrepancia entre la información que proporciona la muestra (X) y la hipótesis H0. Esta medida de discrepancia

         (      ) d = d X, H
           0
    (1.6)
    se denomina estadístico del contraste y será cualquier función de los datos muestrales (                     )
 X  = (X  ,X  ,...,X  )
         1  2       n y de la información de la hipótesis nula (H0).
    La medida de discrepancia debe seguir una distribución conocida cuando H0  sea cierta, de forma que se pueda distinguir entre:
    bulletuna discrepancia grande, la que tiene una probabilidad muy pequeña de ocurrir cuando H0  es cierto.
    bulletuna discrepancia pequeña, la que tiene una probabilidad grande de ocurrir cuando H0  es cierta.
  3. Decidir que valores de d se consideran muy grandes, cuando H0 es cierto, para que sean atribuibles al azar. Ésto es, decidir que discrepancias se consideran inadmisibles cuando H0 es correcto, lo que equivale a indicar el valor del nivel de significación, que se denota por a .
  4. Tomar la muestra (X), calcular el valor del estadistico ^d asociado a la muestra (valor crítico del contraste) y analizar:
    Si d^ es pequeño (pertenece a la región de aceptación), entonces se acepta la hipótesis H0.
    Si ^des grande (pertenece a la región de rechazo), entonces se rechaza la hipótesis H0.

1.3.3 Tipos de Error en un contraste de hipótesis.

Al realizar un contraste se puede cometer uno de los dos errores siguientes:

bulletError tipo I, se rechaza la hipótesis nula H0 cuando es cierta.
bulletError tipo II, se acepta la hipótesis nula H0 cuando es falsa.

  Situación real:
H0 es cierta H0 es falsa
Decisión: ACEPTAR H0 CORRECTO ERROR II
RECHAZAR H0 ERROR I CORRECTO
Tabla 1.1:Situaciones posibles en un contraste de hipótesis.

Debe tenerse en cuenta que sólo se puede cometer uno de los dos tipos de error y, en la mayoría de las situaciones, se desea controlar controlar la probabilidad de cometer un error de tipo I.

Se denomina nivel de significación de un contraste a la probabilidad de cometer un error tipo I, se denota por a y, por tanto,

a = P (rechazar H0 |H0  es cierta)
(1.7)
Fijar el nivel de significación a  equivale a decidir de antemano la probabilidad máxima que se está dispuesto a asumir de rechazar la hipótesis nula cuando es cierta. El nivel de significación lo elige el experimentador y tiene por ello la ventaja de tomarlo tan pequeño como desee (normalmente se toma a = 0'05, 0'01  o 0'001).

La selección de un nivel de significación a  conduce a dividir en dos regiones el conjunto de posibles valores del estadístico de contraste:

bulletLa región de Rechazo, con probabilidad a, bajo H0.
bulletLa región de Aceptación, con probabilidad 1 - a,bajo H0.

Figura 1.1. Tipos de errores. Contraste unilateral, P = 0'05, P = 0'36,

Si el estadístico de contraste toma un valor perteneciente a la región de aceptación, entonces no existen evidencias suficientes para rechazar la hipótesis nula con un nivel de significación  a y el contraste se dice que estadísticamente no es significativo. Si, por el contrario, el estadístico cae en la región de rechazo entonces se asume que los datos no son compatibles con la hipótesis nula y se rechaza a un nivel de significación a. En este supuesto se dice que el contraste es estadísticamente significativo.

Por tanto, resolver un contraste estadístico es calcular la región de aceptación y la región de rechazo y actuar según la siguiente regla de decisión:

Se obtiene la muestra X = (X1,X2, ...,Xn) y se calcula el estadístico del contraste d^.

Si  ^d  (-  Región de Aceptación
==>   Se acepta H0 Si  ^d  (-  Región de Rechazo    ==>   Se
rechaza H
                                              0
(1.8)
Según la forma de la región de rechazo, un contraste de hipótesis, paramétrico o no, se denomina
bulletContraste unilateral o contraste de una cola es el contraste de hipótesis cuya región de rechazo está formada por una cola de la distribución del estadístico de contraste, bajo  H0.
bulletContraste bilateral o contraste de dos colas es el contraste de hipótesis cuya región de rechazo está formada por las dos colas de la distribución del estadístico de contraste, bajo  H0.

Graphic: fig1-2


Figura 1.2. Contraste bilateral. H0 : m = 0, H1 : m/=0.

Graphic: fig1-3

Figura 1.3. Contraste unilateral H0 : m > 0, H1 : m < 0.

 

Ejemplo 1.1. Test de hipótesis estadística.

“La distribución del tamaño en Kb de los ficheros que resultan al digitalizar imágenes con un determinado programa puede suponerse normal. El programa ha sido mejorado en su última versión (versión B) hasta el punto de que quienes lo comercializan garantizan una disminución en el tamaño medio de los ficheros resultantes superior a 6 Kb con respecto a la versión anterior (versión A).

La nueva versión B se envió a probar a un centro de investigación privado que utiliza la versión A. Las últimas 550 imágenes recibidas se digitalizaron con la nueva versión B, obteniéndose que los tamaños de los ficheros resultantes presentaron una media xB = 63'9 y una cuasivarianza s B2 = 105'063. Cuando se comprobó que las 550 imágenes anteriores a éstas, digitalizadas con la versión antigua A, habían proporcionado las siguientes medidas xA = 70'8 y sA2 = 96'04, el centro no consideró realista la diferencia anunciada por el proveedor y devolvieron el producto.

Los proveedores enviaron entonces un representante comercial y éste convenció a los responsables del centro para la realización de una nueva prueba. Las 25 imágenes que había en ese momento en el laboratorio se digitalizaron con las dos versiones del programa A y B. Finalmente se calcularon las diferencias en Kb de los ficheros obtenidos con cada versión (XA  - XB) resultando

5'210 9'607 12'442 11'248 9'776
10'785 -2'368 9'762 8'683 10'783
10'830 12'836 11'487 12'964 5'371
7'343 0'615 12'406 6'151 9'917
5'722 4'693 4'048 8'480 8'151

Estos resultados hicieron cambiar de idea a los responsables del centro y adquirieron la nueva versión B.

Analizar ambas experiencias.

¿Cómo es posible que con tan sólo 25 datos se haya cambiado de opinión si la experiencia primera se realizó en base a un tamaño de muestra 22 veces superior?”

Solución:

Se siguen los siguientes pasos

 
Paso 1: Especificar las hipótesis nula (H0) y alternativa (H1).

Sea mA la esperanza de la distribución de los tamaños de los ficheros una vez digitalizadas las imágenes con la versión A del programa y mB la correspondiente a la versión B actualizada. Se desea investigar si es razonable asumir la afirmación del proveedor. El contraste a realizar es

     {
C1  =_    H0 : mA - mB < 6
        H1 : mA - mB > 6
(1.9)
Se supone que se verifican las siguientes hipótesis:
bulletLas observaciones siguen una distribución normal.
bulletLas observaciones son independientes.
bulletLas dos muestras tienen igual varianza.

Se contrasta la tercera hipótesis de igualdad de las varianzas de las dos muestras.

     {       2     2
C2  =_   H0  : sA2 = sB2
       H1  : sA /= sB
(1.10)
Fijado a = 0'05, se calcula el estadístico del contraste
     s2   105'063
^d2 = -B2-= ---'--- = 1'094.
     sA    96 04

Este valor ^d 2 no pertenece a la región de rechazo especificada para el contraste de varianzas de dos muestras independientes que viene dado por

                               (         (     ))  (        (    )    )
Región de Rechazo para C2   =_    0;F5-419,549 0'025   U  F -5149,549  0'975  ; oo 
                               (   '  )   ( '     )
                           =    0;0835 U   1172; oo   .

Por tanto se acepta la hipótesis de igualdad de las varianzas de las dos muestras.

Figura 1.4. Contraste de igualdad de varianzas.

 
Paso 2: Se elige un estadístico de contraste apropiado: d1 = d1(H0,X). En este problema una buena elección es la siguiente.

                (         )
d = d (H  ,X) = -XA----XB V~ -----(mA---mB)-.
 1   1   0                 1    1
                     ^ST   n--+ n--
                           A     B
(1.11)
Si H0 es cierto, entonces

d1|H0 ~  tn+m -2.
(1.12)
S^T2 es un estimador del parámetro sA2 = sB2 = s2, que viene dado por

^2    n^S2A-+-m-^S2B-
ST =   nA + nB   .
(1.13)
 
Paso 3: Se fija el nivel de significación a, esto es, la probabilidad de error de tipo I. En este ejemplo se utiliza a = 0'05.
 
Paso 4: Se calculan las regiones de rechazo y de aceptación del contraste, teniendo en cuenta si el contraste es unilateral o bilateral.

En el ejemplo el contraste es unilateral y teniendo en cuenta (1.12) la región de rechazo para a = 0'05 es

                            (    ( '  )   )     '
Región de Rechazo para C1  =_  t1098 0 95 ; oo   = (1647, oo ).
(1.14)

Figura 1.5. Contraste de igualdad de medias. Primer estudio.

 
Paso 5: Se obtiene la muestra y utilizando el estadístico de contraste d1 dado en (1.11) se obtiene el valor crítico ^
d=  ^
d (X1,...,Xn).

En el ejemplo en estudio, en primer lugar se calcula la estimación de la varianza

 2   96'04+-105'063-     '             '
sT =       2        = 100 552 ==> sT = 10 027.

Ahora el valor crítico del contraste C1 es

^    -x1--x2---6-    '
d1 =        V~ -2--=  1488.
     10'027  ----
             550

El nivel crítico asociado del contraste es 0'0683 (ver siguiente sección).

 
Paso 6: Se concluye si el test es estadísticamente significativo o no al nivel de significación a según que el valor crítico pertenezca a la región de rechazo o a la región de aceptación, respectivamente.

Como d 1 = 1'488 no pertenece a la región de rechazo dada en se acepta la hipótesis nula. Por consiguiente los datos muestrales no avalan que el tamaño medio de los ficheros disminuye en más de 6 Kb como afirman los vendedores del nuevo programa.

Tal y como se resolvió el problema hay un parámetro que no se controla, el error de tipo II, ya que se desconoce la probabilidad de aceptar la hipótesis nula cuando es falsa.

Si, simultáneamente, se desea controlar la probabilidad de error de tipo I (a) y la probabilidad de error de tipo II (b(h1)) se debe especificar el tamaño muestral que se está dispuesto a asumir. Ésto es, si se quiere controlar el porcentaje de veces que se detecta la hipótesis alternativa (que se denota h = h1) cuando es cierta, que en términos de probabilidad se denota por

1 - b(h1) = P (rechazar H0 |h = h1),

es necesario calcular el tamaño muestral n adecuado para garantizar que ambas probabilidades de error sean las fijadas.

Obviamente existe una relación entre los tres parámetros (n,a y b(h)), conocidos dos de ellos se puede obtener el tercero:

bulletn, tamaño muestral,
bulleta, probabilidad de error de tipo I,
bulletb(h), probabilidad de error de tipo II.

En este ejemplo puede suponerse que existe independencia entre las observaciones muestrales y que no hay relación entre los dos grupos de 550 imágenes digitalizadas por cada una de las dos versiones del programa. Por tanto se trata de dos muestras independientes.

En la segunda experiencia que se propone los datos se han tomado apareados ya que se han ejecutado las dos versiones del programa sobre las mismas imágenes, primero la versión A y después la B. Por tanto hay independencia entre las observaciones de cada muestra pero no entre las observaciones de una muestra respecto a la otra. Para resolver el problema en este segundo contexto y evitar el problema de dependencia, se trabaja con la variable diferencia del tamaño del fichero al digitalizar la imagen con la versión A del programa y el tamaño del fichero al utilizar la versión B (Z  = X  - X  )
      A     B. Se calculan las 25 diferencias entre los tamaños de los ficheros resultantes y se obtiene una muestra única. De la que se obtiene

z = 8'29,       s2Z = 14'7982,       sZ = 3'85.

El contraste es ahora

     {
        H0 : mZ = mA - mB < 6
C3  =_ 
        H1 : mZ = mA - mB >  6
(1.15)
El estadístico del contraste es

d  = Z----6 V~ n.
  3    ^SZ
(1.16)
Bajo las hipótesis supuestas se verifica que la distribución de d3, cuando H0 es cierta, es una distribución t

d3|H0  ~ tn-1.
(1.17)
Para a = 0'05 se obtiene la siguiente región de rechazo
                              (   )
Región de Rechazo de C3  =_  (t24 0'95 , oo ) = (1'7113, oo ).

Utilizando (1.16) se obtiene el siguiente valor crítico

d^ = 5(8'29--6) = 2'97.
 3       3'85

Este valor ^d 3 pertenece a la región de rechazo y se rechaza H0.

Obsérvese que también se rechazaría H0 con a = 0'01 (de hecho el nivel crítico es 0'003). La decisión de rechazo parece clara y con garantías, en contradicción con la decisión de la primera experiencia.

Figura 1.6. Contraste sobre la media. Datos apareados.

¿Por qué esta diferencia en la respuesta?

Viene motivada por la alta variabilidad de las variables del primer experimento XA y XB. Con el muestreo apareado la variabilidad ha disminuido considerablemente, la varianza de la variable diferencia Z es considerablemente inferior a la varianza de XA y XB. La disminución tan fuerte en la variabilidad está motivada en la existencia de una alta correlación positiva entre las variables XA y XB, ya que las imágenes que al digitalizarlas con una versión generan ficheros grandes (pequeños) también producirán ficheros grandes (pequeños) al ser digitalizadas con la otra versión.

 

1.3.4 Nivel crítico y región crítica.

Si el contraste de hipótesis se va estudiar con una única muestra y no de forma repetida y sistemática, se puede utilizar una filosofía alternativa y más informativa que se basa en los conceptos de nivel crítico y región crítica.

 

Se denomina nivel crítico o p-valor a la probabilidad p de obtener una discrepancia con H0 mayor o igual que el valor crítico ^ d cuando H0 es correcto.

             (      ||^||               )
p - valor = P d||>  |d| |H0 es correcto  .
(1.9)

La región crítica es el conjunto de valores para los cuales d es mayor o igual que el valor crítico d

Por tanto,

 

P (d  (-  {región crítica} |H es
correcto) = p- valor
                        0

 

Comentarios:

  1. El nivel crítico sólo puede calcularse una vez tomada la muestra, obteniéndose niveles críticos distintos para cada muestra.

  2. El nivel crítico p puede interpretarse como un nivel mínimo de significación en el sentido de que niveles de significación a iguales o superiores al p - valor llevarán a rechazar la hipótesis nula.

    Por tanto, cuanto menor sea el p - valor mayor es el grado de incompatibilidad de la muestra con H0, lo que lleva a rechazar H0.

  3. El cálculo del nivel crítico no proporciona de modo sistemático una decisión entre H0 y H1.

  4. En las Figuras 1.7 (y 1.8) pueden verse representados el nivel crítico y la región crítica en un contraste unilateral (y bilateral) acerca de la media, bajo la hipótesis de normalidad.

 


Graphic: fig1-7

Figura 1.7. Nivel crítico. Contraste unilateral sobre la media con ^D = 0'84.

 



Figura 1.8. Nivel crítico. Contraste bilateral sobre la media con = 0'84.

 

1.3.5 Potencia de un contraste.

Para medir la bondad de un contraste de hipótesis se utiliza el concepto de potencia del contraste. Considérese que se está estudiando un contraste de hipótesis acerca del parámetro h, siendo la hipótesis nula H0 : h  (-  _O_0, _O_0 < R,

frente a la hipótesis alternativa H  : h  (-  _O_ , _O_  < R,
  1      1     1

Se denomina potencia al nivel a del estadístico de contraste d a la función que asigna a cada valor del parámetro h la probabilidad de rechazar H0 cuando h es correcto.

 

Esto es,

 

P otencia :  _O_ = _O_0  U  _O_1
< R  -->   [0,1]
            h                 -->   P ot(h)

donde

(1.10)

 

Comentarios:

  1. Al grafo de la potencia se lo denomina curva de potencia. En algunos textos se trabaja con la función curva característica de operación (OC) definida por

    OC  (h) = 1 - Pot(h)
    (1.11)
  2. Si denotamos por a a la probabilidad de error de tipo I, se verifica que  A h  (-  _O_0 (H0 es correcto), entonces
Potencia (h) < a

    Cuanto más lejana se encuentra la alternativa H1 de H0 menor es la probabilidad de incurrir en un error tipo II (b) y, por consiguiente, la potencia tomará valores más próximos a 1.

  3. Si la potencia en la hipótesis alternativa es siempre muy próxima a 1 entonces se dice que el estadístico de contraste es muy potente para contrastar H0 ya que en ese caso las muestras serán, con alta probabilidad, incompatibles con H0 cuando H1 sea cierta. 

Por tanto puede interpretarse la potencia de un contraste como su sensibilidad o capacidad para detectar una hipótesis alternativa.

  1. Fijado un nivel de significación a, un contraste d1 se dice más potente que otro d2 para contrastar la hipótesis nula H0 si

    (1.12)
  2. En la Figura 1.9. se representa la función de potencia del contraste H0 : m = 0 frente a la alternativa H1 : m/=0 (contraste bilateral), bajo la hipótesis de normalidad, con a = 0'10 y tamaño muestral n = 100.

    En la Figura 1.10. se representa la función de potencia del contraste H0 : m < 0 frente a la alternativa H1 : m > 0 (contraste unilateral), bajo la hipótesis de normalidad, con a = 0'10 y tamaño muestral n = 100.


Graphic: fig1-9

Figura 1.9. Función de Potencia. Contraste bilateral acerca de la media.

Graphic: fig1-10

Figura 1.10. Función de Potencia. Contraste unilateral acerca de la media.

1.3.6 Algunos contrastes paramétricos importantes.

Se exponen en esta sección algunos de los estadísticos de contraste más importantes para contrastar hipótesis nulas del tipo H0 : h = h0, siendo h un parámetro desconocido y de cuyo valor depende la distribución de una variable de interés X.

bullet

Contrastes sobre la media. A partir de una muestra (X  ,X ,...,X  )
   1   2      n extraída de una población X normal con media m y varianza s2 desconocidas, se desea contrastar la hipótesis nula H0 : m
= m0.

El estadístico de contraste es

             V~ - d1 = X---m0- n,
       S^
(1.13)

donde ^S es la desviación típica muestral corregida (ver 1.3). Si H0 es cierto d1 ~ tn- 1.

 

bullet

Contrastes sobre la varianza. Sea la muestra aleatoria simple (X1,X2,
...,Xn) extraída de una población X normal con varianza s2, se desea contrastar H   :
s2 = s2.
  0        0

El estadístico de contraste es

     (n - 1) ^S2 d2 = -----2----.
         s
(1.14)

Si H0 es cierto 

d2 ~ x2n-1.

 

bullet

Contrastes sobre la igualdad de varianzas. Sean dos muestras aleatorias simples (X1,X2, ...,Xn) e (Y1,Y2,...,Ym) obtenidas de dos poblaciones X e Y, con distribuciones respectivas

  N( 2 )
mX ,sX y N( 2 )
 mY,sY

Se desea contrastar

   2 H
: s2 = s2 <==>  sX-=  1.
  0  X     Y    s2Y

El estadístico de contraste es

     S^2 d3 = --X2.
     S^Y
(1.15)

Si H0 es cierto 

d3 ~ Fn -1,m
-1.

 

bullet

Contrastes sobre la diferencia de medias, muestras independientes e igualdad de varianzas. Sean dos muestras aleatorias simples (X1,X2, ...,Xn) e (Y1,Y2,...,Ym) obtenidas de dos poblaciones X e Y, con distribuciones N(mX,s2) y N(mY
,s2). Por tanto se supone que sX2 = sY 2 = s2. Se desea contrastar

  H   : m = m
<==> m  -  m  = 0.
  0   X     Y    X     Y

El estadístico de contraste es

d  = ---X V~ ---Y---,
 4        1-  -1
     ^ST   n + m
(1.16)

siendo

      (n- 1) ^S2 + (m - 1)S^2 S^2T =
--------X------------Y,
            n + m - 2
(1.17)

un estimador insesgado eficiente de la varianza que se calcula a partir de la información que proporcionan ambas muestras.

Si H0 es cierto se verifica que

 

d4 ~ tn+m -2.

 

bullet

Contrastes sobre la diferencia de medias, muestras independientes y varianzas desiguales. Sean dos muestras aleatorias simples (X1,X2, ...,Xn) e (Y1,Y2,...,Ym) obtenidas de dos poblaciones X e Y, con distribuciones respectivas N(     2 )
 mX ,sX y N( )
 mY,s2Y,y se supone que sX2 sY 2. Se desea contrastar

 

H  : m =  m
<==> m   - m  = 0
 0   X     Y     X    Y

El estadístico de contraste que se utiliza es

     --X---Y----- d5 =  V~  ^2   ^2
       SX-+  SY-
        n    m
(1.18)

Si H0 es cierto se verifica que 

d  ~ t
 5    g

siendo g = n + m - 2 + d, con d un término de corrección (ver Cao y otros (2001)).

bullet

Contrastes sobre la diferencia de medias, muestreo apareado. En este caso las dos muestras aleatorias simples tienen igual tamaño muestral (X1,X2, ...,Xn) e (Y1,Y2,...,Yn) y son obtenidas al realizar dos observaciones Xi e Y i sobre el mismo individuo, el i-ésimo. Por la naturaleza del muestreo apareado las dos muestras son dependientes. Para eliminar este problema se estudia la variable diferencia Z = Y - X, por tanto, a partir de las dos muestras iniciales se calcula la muestra de diferencias (Z1,Z2, ... ,Zn), Zi = Xi - Yi . Para contrastar la hipótesis

 

H0 :
mX = mY <==> mX  - mY = 0 <==> mZ  = 0.

Se utiliza el siguiente estadístico de contraste

d  = -Z- V~ n.
 6   ^SZ
(1.19)

Si H0 es cierto

  d6 ~ tn- 1.