Gebrauchtwagenkäufe

In diesem Beispiel analysieren wir die Gebrauchtwagenpreise mit echten Daten, welche von eBay Kleinanzeigen extrahiert wurden.

Es kann folgendes Problem auftreten:

  • Echte Daten enthalten falsche Daten
  • Beispiel:
    • Auto mit 100.000ps
    • Auto mit einem Preis von 100.000.000€
  • Diese Daten würden unser Modell verzerren
  • Daher müssen wir die entfernen
  1. Zuerst müssen wir die .csv Datei einlesen. Dann schauen wir uns die Daten an und wir können erkennen wie viel Ps, Kilometer die Autos haben, den Namen usw. In unserem Fall interessieren wir uns nur für den Preis und Kilometer.
.csv Datei einlesen
  1. Als erster Schritt lassen wir unsere Daten im Scatter-Plot anzeigen. Da sehen wir dann alle Kilometer und Preis Werte.
Daten im Scatter-Plot
  1. Was wir dann machen ist, dass wir die Lineare Regression ausführen. Es heißt wir importieren unsere sklearn Bibliothek, füttern das ganze hier mit den Kilometer als X-Wert und dem Preis als Y-Wert (wichtig sind die doppelten eckigen Klammern [[ ]] weil das ist der Format – Lineare Regression das ganze erwartet) und dann können wir uns Intercept und denKoeffizienten ausgeben lassen.
Lineare Regression ausführen
  1. Wenn wir jetzt Werte für unsere Linie vorhersagen, dann können wir sagen, dass der niedrigste Wert die 0 ist und die Linie soll bis zum X-Wert 130.000 gehen.
Werte für unsere Linie vorhersagen
  1. Wenn wir das ganze jetzt in einer Grafik zeichnen. Das heißt zeige wieder den Scatter-Plot. Dann eine Linie über unsere zwei ausgewählte Punkte zeichnen und die gewünschte Farbe auswählen.
Grafik zeichnen
  1. Wir können auch eine Vorhersage machen, zum Beispiel mit 50.000km und dann hätten wir als Ergebnis 11.600€ die das Auto noch im Schnitt mit 50.000km Wert ist.
eine Vorhersage

Nächste Seite

Verpasse diese Tipps nicht!

Wir senden keinen Spam! Erfahre mehr in unserer Datenschutzerklärung.