Logotipo de Zephyrnet

Comprensión de las intersecciones de regresión lineal en lenguaje sencillo – DATAVERSITY

Fecha:

A menudo me preguntan sobre el papel de los interceptos en los modelos de regresión lineal, especialmente los interceptos negativos. Aquí está la publicación de mi blog sobre ese tema en palabras simples con términos estadísticos mínimos.  

Los modelos de regresión se utilizan para hacer predicciones. El coeficientes en la ecuación Defina la relación entre cada variable independiente y la variable dependiente. La intersección o constante en el modelo de regresión representa el valor medio de la variable de respuesta cuando todas las variables predictoras del modelo son iguales a cero. En la regresión lineal, la intersección es el valor de la variable dependiente, es decir, Y cuando todos los valores son variables independientes y X son cero. Si X a veces es igual a 0, la intersección es simplemente el valor esperado de Y en ese valor. Matemática y gráficamente, a continuación se muestra un modelo de regresión lineal simple (SLR).

Pero, ¿cuál es la interpretación empresarial del intercepto en el modelo de regresión? En términos comerciales, una intersección representa una línea de base o punto de partida para la variable dependiente, si las variables independientes se establecen en cero. La intersección sirve como punto de partida para evaluar los efectos de las variables independientes sobre la variable dependiente. Refleja la porción de la variable dependiente que no está influenciada por las variables independientes incluidas en el modelo. Ayuda a cuantificar el impacto de los cambios en las variables independientes a partir de este valor de referencia. Por ejemplo, en un modelo de predicción de ventas, el intercepto podría representar las ventas esperadas cuando todos los esfuerzos de marketing, es decir, los predictores son cero. En finanzas, la intercepción puede representar costos fijos o generales en los que se incurre independientemente del nivel de actividad u otros factores. 

Técnicamente, la intersección en el modelo de regresión lineal puede ser positiva, negativa o incluso cero.

  1. Intercepción positiva: Si la intersección en el modelo de regresión es positiva, significa que el valor predicho de la variable dependiente (Y) cuando la variable independiente (X) es cero es positivo. Esto implica que la línea de regresión cruza el eje y por encima del valor cero.
  2. Interceptación negativa: Por el contrario, si la intersección en un modelo de regresión lineal es negativa, significa que el valor predicho de Y cuando X es cero es negativo. En este caso, la línea de regresión cruza el eje y por debajo del valor cero.
  3. Intercepción cero: Si la intersección en un modelo de regresión es cero, implica que la línea de regresión pasa por el origen (0,0) en el gráfico. Esto significa que el valor predicho de la variable dependiente es cero cuando todas las variables independientes también son cero. En otras palabras, no hay ningún término constante adicional en la ecuación de regresión. Esta situación es extremadamente tarifaria y muy teórica.

Básicamente, tratas con intersecciones negativas o positivas, y cuando te encuentras con la intersección negativa, tratas con la intersección negativa de la misma manera que lo harías con una intersección positiva. Pero en términos prácticos, una intersección negativa puede tener sentido o no dependiendo del contexto de los datos que se analizan. Por ejemplo, si está analizando la temperatura del día (X) y las ventas de helado (Y), una intersección negativa no sería significativa ya que es imposible tener ventas negativas. Sin embargo, en otros ámbitos, como el análisis financiero, una intersección negativa podría tener sentido.

A continuación se presentan algunos enfoques que puede considerar cuando tiene intersecciones negativas:

  1. Verifique si hay errores en los datos y suposiciones: antes de realizar cualquier ajuste, asegúrese de que se cumplan las suposiciones de regresión. Esto incluye linealidad, independencia, homocedasticidad (perteneciente a los residuos), normalidad de las variables de datos y residuos, valores atípicos y más. Si se violan estos supuestos, es necesario abordarlos primero.
  2. Aplique perspicacia para los negocios y sentido común y compruebe si la interpretación de la intersección negativa tiene sentido práctico. Una intersección negativa podría tener sentido dependiendo de lo que represente. Por ejemplo, en datos financieros, una intersección negativa podría indicar un punto de partida por debajo de cero, lo que puede ser perfectamente razonable. Pero si analiza datos sobre la temperatura y las ventas de helado, una intersección negativa no sería significativa ya que es imposible tener ventas negativas.
  3. Centrar las variables. Los modelos de regresión son válidos sólo para un rango determinado de valores de datos. Pero a veces, los valores de las variables independiente y dependiente pueden estar fuera del rango dado. En este sentido, centrar implica restar un valor constante o media aritmética de una variable (independiente) de cada uno de sus valores. Esto puede facilitar la interpretación, especialmente si las variables independientes (X) tienen valores cero. Básicamente, al centrar las variables alrededor de sus medias, la intersección representa el valor predicho de la variable dependiente cuando las variables independientes están en sus valores medios. Además, en algunos casos, los valores extremos o atípicos en los datos pueden provocar inestabilidad numérica en los modelos de regresión. Centrar las variables puede mitigar estos problemas al reducir la escala de las variables y hacer que el modelo de regresión sea más estable.
  4. Asegúrese de que las variables de confusión estén en el modelo de regresión. Agregar variables explicativas adicionales o variables de confusión al modelo de regresión puede ayudar a explicar la intersección negativa.

En general, es importante señalar que los modelos de regresión lineal se basan en suposiciones. En primer lugar, suponen una relación lineal entre variables, que puede no siempre ser cierta en escenarios del mundo real. Además, la regresión lineal depende de datos distribuidos normalmente y es muy sensible a los valores atípicos. Por último, pero no menos importante, es posible que la regresión lineal no funcione bien con relaciones no lineales y, en tales casos, modelos más complejos como la regresión polinómica o la regresión no lineal pueden ser más apropiados.

Referencia

punto_img

Información más reciente

punto_img