6.1 Introducción a los modelos de regresión.Objetivos.

Los Modelos de Regresión estudian la relación estocástica cuantitativa entre una variable de interés y un conjunto de variables explicativas. Estos modelos son muy utilizados y su estudio conforma un área de investigación clásica dentro de la disciplina de la Estadística desde hace muchos años.

Cuando se estudia la relación entre una variable de interés, variable respuesta o variable dependiente (Y) y un conjunto de variables regresoras (explicativas, independientes) (X1,X2,...,Xk), puede darse las siguientes situaciones:

bulletExiste una relación funcional entre ellas, en el sentido de que el conocimiento de las variables regresoras determina completamente el valor que toma la variable respuesta, ésto es,
Y = m
(X1,X2,...,Xk).
Ejemplo: la relación que existe entre el tiempo (Y ) que tarda un móvil en recorrer una distancia y dicha distancia (X) a velocidad constante

 

bulletNo exista ninguna relación entre la variable respuesta y las variables regresoras, en el sentido de que el conocimiento de éstas no proporciona ninguna información sobre el compartamiento de la otra. 

Ejemplo: la relación que existe entre el dinero (Y ) que gana una persona adulta mensualmente y su altura (X).

bulletEl caso intermedio, existe una relación estocástica entre la variable respuesta y las variables regresoras, en el sentido de que el conocimiento de éstas permiten predecir con mayor o menor exactitud el valor de la variable respuesta. Por tanto siguen un modelo de la forma,
Y = m (X1,X2, ...,Xk) + e,
 

siendo m la función de regresión desconocida y  e una variable aleatoria de media cero (el error de observación).

Las relaciones estocásticas son las que ocurren en la mayoría de las situaciones y su estudio se corresponde con los denominados Modelos de Regresión.

El objetivo básico en el estudio de un modelo de regresión es el de estimar la función de regresión, m,  y el modelo probabilístico que sigue el error aleatorio e, ésto es, estimar la función de distribución Fe de la variable de error. La estimación de ambas funciones se hace a partir del conocimiento de una muestra de las variables en estudio, {((X1,i,X2,i,...,Xk,i),Yi) : i = 1,2,...,n}.

Una vez estimadas estas funciones se tiene conocimiento de:

bulletLa relación funcional de la variable respuesta con las variables regresoras, dada por la función de regresión que se define como sigue,
m (x1,...,xk) = E (Y/X1 = x1,...,Xk =
xk).

Esto permite tener una idea general del comportamiento de la variable respuesta en función de las regresoras.

bulletSe puede estimar y predecir el valor de la variable respuesta de un individuo del que se conocen los valores de las variables regresoras. Ésto es, de un individuo t se sabe que X1 = x1,t,...,Xk = xk,t, entonces se puede predecir el valor de Y t y calcular un intervalo de predicción del mismo.