Cómo funciona el algoritmo Regresión lineal

La regresión lineal es un método de aprendizaje automático supervisado utilizado por la herramienta Entrenar con AutoML y busca una ecuación lineal que describe mejor la correlación de las variables explicativas con la variable dependiente. Se logra ajustando una línea a los datos mediante mínimos cuadrados. La línea intenta minimizar la suma de los cuadrados de los residuales. El residual es la distancia entre la línea y el valor real de la variable explicativa. Encontrar la línea de mejor ajuste es un proceso iterativo.

A continuación, encontrará un ejemplo de una ecuación de regresión lineal resultante:

Ecuación de regresión lineal

En el ejemplo anterior, y es la variable dependiente, y x1, x2, etc. son las variables explicativas. Los coeficientes (b1, b2, etc.) explican la correlación de las variables explicativas con la variable dependiente. El signo de los coeficientes (+/-) designa si la variable está correlacionada positiva o negativamente. b0 es la intercepción que indica el valor de la variable dependiente, suponiendo que todas las variables explicativas sean 0.

En la siguiente imagen, se describe un modelo de regresión lineal mediante la línea de regresión y = 153,21 + 900,39x. El modelo describe la relación entre la variable dependiente, Progresión de la diabetes, y la variable explicativa, Concentración de triglicéridos en suero. Se muestra una correlación positiva. En este ejemplo, se muestra un modelo de regresión lineal con dos variables. Aunque no es posible visualizar modelos que tengan más de tres variables, en la práctica, el modelo puede tener cualquier número de variables.

Ejemplo de regresión lineal

Un modelo de regresión lineal ayuda a predecir el valor de una variable dependiente y también puede ayudar a explicar la precisión de la predicción. Se indica con los valores R cuadrado y valor p. El valor R cuadrado indica qué parte de la variación de la variable dependiente se puede explicar por medio de la variable explicativa, mientras que el valor p explica la fiabilidad de esa explicación. Los valores de R cuadrado deben estar comprendidos entre 0 y 1. Un valor de 0,8 significa que la variable explicativa puede explicar el 80 por ciento de la variación en los valores observados de la variable dependiente. Un valor de 1 significa que se puede hacer una predicción perfecta, lo cual es raro en la práctica. Un valor de 0 significa que la variable explicativa no ayuda en absoluto a predecir de la variable dependiente. Al utilizar un valor p, puede probar si el efecto de la variable explicativa en la variable dependiente es significativamente distinto de 0.

Recursos adicionales

Regresión lineal para aprendizaje automático

Regresión lineal en el aprendizaje automático


En este tema
  1. Recursos adicionales