Los Modelos de Regresión estudian la relación estocástica cuantitativa entre una variable de interés y un conjunto de variables explicativas. Estos modelos son muy utilizados y su estudio conforma un área de investigación clásica dentro de la disciplina de la Estadística desde hace muchos años.
Cuando se estudia la relación entre una variable de interés, variable
respuesta o variable dependiente
y un conjunto de variables regresoras (explicativas,
independientes)
, puede darse las
siguientes situaciones:
| Existe una relación funcional entre ellas, en el sentido de
que el conocimiento de las variables
regresoras determina completamente el valor que
toma la variable respuesta, ésto es, |
| No exista ninguna relación entre la variable respuesta y las variables regresoras, en el sentido de que el conocimiento de éstas no proporciona ninguna información sobre el compartamiento de la otra. |
Ejemplo: la relación que existe entre el dinero (Y ) que gana una persona adulta mensualmente y su altura (X).
| El caso intermedio, existe una relación
estocástica entre la variable respuesta y las
variables regresoras, en el sentido de que el
conocimiento de éstas permiten
predecir con
mayor o menor exactitud el valor de la variable
respuesta. Por tanto siguen un modelo de la
forma, |
siendo m la función de
regresión desconocida y
una variable
aleatoria de media cero (el error de observación).
Las relaciones estocásticas son las que ocurren en la mayoría de las situaciones y su estudio se corresponde con los denominados Modelos de Regresión.
El objetivo
básico en el estudio de un
modelo de regresión es el de
estimar la función de
regresión, m, y el modelo
probabilístico que sigue el
error aleatorio
, ésto es,
estimar la función de
distribución F
de la variable de error. La estimación de ambas funciones se hace a partir del
conocimiento de una muestra de las
variables en estudio,
.
Una vez estimadas estas funciones se tiene conocimiento de:
| La relación
funcional de la variable respuesta con las variables regresoras,
dada por la función
de regresión que
se define como sigue, Esto permite tener una idea general del comportamiento de la variable respuesta en función de las regresoras. | |
| Se puede estimar y predecir el valor de la variable respuesta de un individuo del que se conocen los valores de las variables regresoras. Ésto es, de un individuo t se sabe que X1 = x1,t,...,Xk = xk,t, entonces se puede predecir el valor de Y t y calcular un intervalo de predicción del mismo. |