En esta sección se presenta el desarrollo en detalle de un supuesto práctico del modelo de regresión lineal simple, en los cálculos se utiliza toda la teoría expuesta en este capítulo.
Ejemplo 6.3.
“Se desea
estudiar la posible relación entre los
gastos en material informático, en múltiplos de cien mil euros,
de una empresa
y sus ingresos globales, en millones
de euros,
.
Para ello se recoge una muestra de datos anuales de gastos e ingresos
de 65 empresas, los datos muestrales son los de la tabla adjunta. Estudiar
la posible existencia de una relación lineal entre la variable respuesta gasto
en material informático y la variable regresora ingreso
global”.
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
20 | 50 | 100 | 200 | 300 | 400 | 500 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

Estimadores de los coeficientes de la recta de regresión son

o bien,
que indica que por cada millón de euros de ingreso en una empresa se utiliza 20.040 euros en material informático.

Figura 6.9. Datos y recta ajustada.

Figura 6.10. Residuos del modelo.
Intervalos de confianza al
95% (
= 0'05)
para los tres parámetros del modelo.
Para
2

Para
0,


Para
1,

Nota: si se hubiese
planteado el problema de forma inversa y se quisiera calcular la recta de
regresión del ingreso
respecto al gasto
,
se obtiene,
o despejando, para comparar con la recta de regresión de Y sobre X,
Se comprueba que las dos rectas de regresión no coinciden (observar la Figura 6.11.).

Figura 6.11. Gráfica de las dos rectas de regresión.
Contraste C1,
H0
:
1
= 0 frente a H1
:
1
0.

Del p-valor próximo a cero1 se concluye que la variable regresora X influye linealmente en la variable dependiente Y.
Contraste C0,
H0
:
0
= 0 frente a H1
:
0
0.

Tabla ANOVA. Contraste de regresión.
Con los datos del problema se obtiene la siguiente tabla ANOVA
Tabla ANOVA
|
|
|
|
|
| Fuentes Variación | Suma Cuadrados | Gr. libertad | Varianzas |
|
|
|
|
|
|
|
|
|
|
| Por la recta |
75.602'5
|
1
|
|
|
|
|
|
|
| Residual |
8.544'7
|
63
|
|
|
|
|
|
|
| Global |
84.147'1
|
64
|
|
|
|
|
|
|

Contraste de linealidad.
Dado que para cada valor de X se tienen varios valores de Y se pueden calcular las medias muestrales condicionadas, lo que permite descomponer la suma de los residuos al cuadrado y obtener la siguiente tabla ANOVA
Tabla ANOVA
|
|
|
|
|
| Fuentes Variación | Suma Cuadrados | Gr. libertad | Varianzas |
|
|
|
|
|
|
|
|
|
|
| Por la recta |
75.602'5
|
1
|
|
|
|
|
|
|
| scR(1) |
314'7
|
5
|
|
|
|
|
|
|
| scR(2) |
8.229'9
|
58
|
|
|
|
|
|
|
| Residual |
8.544'7
|
63
|
|
|
|
|
|
|
| Global |
84.147'1
|
64
|
|
|
|
|
|
|

Se acepta claramente la hipótesis de que la función de regresión es lineal.
Coeficiente de determinación y correlación lineal simple.
El coeficiente de determinación es
El modelo de regresión lineal construído explica el 89'85% de variabilidad de la variable respuesta.
El coeficiente de correlación lineal muestral es,
Existe una alta correlación positiva.
Estimación de la media condicionada.
“Se quiere estimar el gasto medio en material informático de las empresas cuyos ingresos globales son de 300 y 800 millones anuales, respectivamente. Calcular intervalos de confianza al 90% para dichas medias condicionadas.”
Para las empresas con 300 millones de ingresos se obtiene
Se calcula el número de observaciones equivalentes

La varianza del estimador es
El intervalo de confianza es
Para x = 800, se obtiene

Comparando los intervalos de confianza obtenidos se observa que el relativo a x = 800 tiene una longitud mucho mayor que en el caso de x = 300. Esto es debido a que el punto x = 300 está más cerca de la media muestral x = 233'231 que el segundo punto x = 800.
Predicción.
“Predecir el gasto en material informático de la empresa MEGA1 y MEGA2 cuyos ingresos globales son de 300 y 800 millones, respectivamente. Calcular intervalos de predicción al 90% para dichas predicciones”.
Para la empresa MEGA1, con x = 300, la predicción de gasto es
Con varianza
El intervalo de predicción es
Para la empresa MEGA2, con x = 800, se obtiene la predicción
El intervalo de predicción es
En el cuadro adjunto se comparan las longitudes de los intervalos de confianza obtenidos
|
|
|
|
| Longitud de los I.C. al 90% | x = 300 | x = 800 |
|
|
|
|
| Estimación de mt |
5'180
|
16'770
|
|
|
|
|
| Predicción de yt |
39'227
|
42'346
|
|
|
|
|

Figura 6.12. Recta de regresión