Lineaire regressie duidelijk uitgelegd! Lineaire regressie modelleert de relatie tussen een afhankelijke variabele (y) en twee of meer onafhankelijke variabelen (x1, x2 ...) ❗️Voor de eenvoud bespreken we lineaire regressie met een enkele onafhankelijke variabele. Wiskundige representatie: y=mx+c waarbij: - y de afhankelijke variabele is - x de onafhankelijke variabele is - m de helling van de lijn is - c de y-intercept is Kostenfunctie: ❗️Het doel is om de beste waarden voor m en c te vinden die de fout tussen de voorspelde waarden en de werkelijke waarden voor alle datapunten minimaliseren. Zo ziet de kostenfunctie eruit, een gemiddelde kwadratische fout: MSE= 1/N∑(yi​−(m*xi​+c))**2 Waarbij: - N het aantal datapunten is. - yi​ de werkelijke waarde voor het i-de datapunt is. - mxi​+c de voorspelde waarde voor het i-de datapunt is. ...