Das Spiel gegen die KI: Wie man den Algorithmus zum Narren hält
Was für Daten dem Machine-Learning-Algorithmus zugetragen werden, spielt eine große Rolle in Bezug auf die Ergebnisse. Hat man die Skalierung vergessen, kriegt man verzerrte Ergebnisse. Hat man fehlende Werte, kriegt man teilweise gar keine. Aber warum ist das eigentlich so? Wie kann ich die Probleme umgehen?
In dem Vortrag geht es darum, praktisch zu zeigen, wie Daten vernünftig aufbereitet werden, um verzerrte oder auch gar keine Ergebnisse zu vermeiden. Des Weiteren wird ein Vergleich von Ergebnissen gezogen. Wie schneidet ein Algorithmus mit aufbereiteten Daten, im Vergleich zu einem Algorithmus mit Rohdaten ab? Gemessen wird dies anhand von Ergebnissen eines Vorhersagemodells.
Vorkenntnisse
- Die Teilnehmenden benötigt keine speziellen Vorkenntnisse
- Vorteilhaft wäre allerdings ein Verständnis für Programmiersprachen (bevorzugt Python), um dem Vortrag folgen zu können
Lernziele
- Grundlegendes Verständnis darüber, wie ein ML-Algorithmus funktioniert und wo er angewandt werden kann
- Verstehen, warum die Datenvorbereitung einer der wichtigsten Schritte im Erstellen einer ML-Pipeline ist
- Wissen, welche Probleme bei der Datenaufbereitung entstehen können und wie man diese löst