Reinforcement Learning: Hands On

In diesem Workshop lernen Sie wie Maschinen komplexe Abläufe und vorausschauendes Handeln lernen können. Mit diesem Ansatz fliegen autonome Helikopter Akrobatikmanöver oder der Weltmeister in Go wurde damit geschlagen. Ein Trainings-Datensatz mit den richtigen Antworten wird nicht benötigt, auch kein hart-codiertes Spezialwissen. Der Ansatz nennt sich Reinforcement Learning (RL) und ist fast schon magisch.

Wir werden sehen wie sich eine praktische Fragestellung aus der realen Welt als Reinforcement-Learning-Problem formulieren lässt, welche Aufgaben für RL geeignet sind und für welche besser klassisches Machine Learning zum Zuge kommt. Mit einem begleitenden Python-Notebook implementieren wir schrittweise alle Lösungselemente, sehen die Funktionsweise einer modernen RL-Library, beleuchten die Rolle von neuronalen Netzen und loten Optimierungsmöglichkeiten aus.

Die Python-Notebooks sind auf Colab gehostet. Sie benötigen also lediglich einen Laptop mit einem aktuellen Chrome-Browser. Gerne diskutieren wir auch gemeinsam von Teilnehmerinnen und Teilnehmern mitgebrachte Anwendungsideen.

Vorkenntnisse

Basiskenntnisse in Programmierung und ein grundsätzliches Verständnis von neuronalen Netzen. Die Implementation erfolgt in Python, OpenAI Gym und TensorFlow. Spezifische Vorkenntnisse dazu sind aber keine Voraussetzung, um dem Workshop folgen zu können.

Lernziele

• Wie funktioniert Reinforcement Learning?
• Was sind die Voraussetzungen, um es anzuwenden?
• Wie wird es konkret angewandt?
• Aufbau eines aktuellen RL-Frameworks
• Hands-on Implementierung

 

Speaker

 

Oliver Zeigermann
Oliver Zeigermann ist Entwickler, Architekt, Berater und Coach. Oliver hat über Jahrzehnte in vielen unterschiedlichen Sprachen und mit vielen Technologien Software entwickelt. In den letzten Jahren ist er wieder tiefer in den Bereich Machine Learning eingestiegen. Er knüpft damit an sein Studium der Künstlichen Intelligenz in den 90er-Jahren an.

Christian Hidber
Christian Hidber arbeitet bei bSquare als Consultant mit Fokus auf Machine Learning, .Net und Azure. Nach seinem Mathematikstudium doktorierte er an der ETH Zürich und arbeitete als Postdoc am International Computer Science Institute in Berkeley (USA).

Gold-Sponsoren

HMS
Structr

Silber-Sponsoren

codecentric
Phytec

Bronze-Sponsor

incontext.technology GmbH

data2day-Newsletter

Sie möchten über die data2day
auf dem Laufenden gehalten werden?

 

Anmelden