Eine Reise durch den Dschungel skalierbarer Machine-Learning-Systeme

Seit den letzten Jahren entwickelt sich Machine Learning zu einem Kernbestandteil vieler Unternehmen und Domänen. Stetig steigende Datenmengen und zunehmend komplexere Analytik führen in der Systemlandschaft zu der Entwicklung einer Reihe skalierbarer Machine-Learning-Plattformen mit unterschiedlichen Systemabstraktionen und Eigenschaften, um diesen Anforderungen gerecht zu werden. Systeme wie sog. "Parameter Server" stellen dem Anwender einen Satz an Low-level-Primitiven bereit und überlassen dem Anwender die Wahl und Umsetzung einer geeigneten Parallelisierungsstrategie.

Komplementäre Ansätze wie Spark und GraphLab dagegen basieren auf konkreten Ausführungsmodellen und stellen reichhaltige Programmierabstraktionen zur Umsetzung bereit. Das ermöglicht es dem Anwender, auf abstrakter(er) Ebene mit den Parallelisierungs- und Verteilungsaspekten von ML-Algorithmen umzugehen. Die diametrale Evolution der Systeme ist eine Folge des breiten Spektrums der zur Verfügung stehenden Verfahren. Aufgrund struktureller Eigenschaften erfordern viele Algorithmen unterschiedliche Parallelisierungs- und Ausführungsansätze, um effizient in großen Maßstab
eingesetzt werden zu können.

In diesem Vortrag werden eine Reihe unterschiedlicher Systemansätze und damit gekoppelten Programmiermodelle vorgestellt, für welche "Klasse an Problemen" sie geeignet sind.

Skills
Grundlagen im maschinellen Lernen, Grundlagen im Bereich Scalable Data Analytics (z.B MapReduce, Spark, Flink, ...)

Lernziele
Der Vortrag vermittelt einen Überblick (und eine Klassifizierung) über die reichhaltige Systemlandschaft skalierbarer ML-Plattformen.

// Referent

// Tobias Herb

ist Doktorand am Fachgebiet Verteilter und Komplexer IT Systeme (CIT) der Technischen Universität Berlin. Er forscht im Rahmen des DFG-geförderten Projekts Stratosphere II, dessen Vorgängerprojekt Bekanntheit als Apache Flink erlangt hat. Der primäre Forschungsfokus liegt auf Ausführungsmodellen und deklarativen Programmierabstraktionen skalierbarer Machine-Learning-Algorithmen.

News
- Wir wünschen unseren rund 240 Teilnehmern eine gute Anreise!03.10.2016
- Jetzt steht unser Gold-Sponsor fest: inovex! Herzlich Willkommen.30.08.2016
+ / -
- Mit etwas mehr als 220 Teilnehmern ist die data2day nun frühzeitig ausverkauft.29.08.2016
- Wir richten am 6. Oktober mit codecentric das data2day Meetup aus.24.08.2016
- Wir haben bereits heute die Teilnehmerzahl des Vorjahres erreicht!16.08.2016
- Das Programm der data2day steht nun online. Damit verbunden kann man sich ab sofort für die Konferenz registrieren.05.07.2016
- Die Verlängerung des CfP hat gefruchtet. Knapp 80 Einreichungen versprechen eine spannende Auswahl.17.05.2016
- Es gab zu viele Bitten, den CfP zu verlängern. Deswegen ist der neue Termin dafür der 16. Mai, also in genau einer Woche.09.05.2016
- Noch bis nächsten Montag können Sie Vorschläge und Workshops vorschlagen.02.05.2016
- Wer sich sein Ticket für die data2day im Oktober schon sichern möchte, kann dies jetzt online tun.29.04.2016
- Ab sofort kann man sich für die nächste Ausgabe der data2day mit einem Vortrag oder Workshop bewerben.16.02.2016
- Einen sehr wohlwollenden Rückblick auf die data2day 2015 vermittelt der Konferenzbericht von Stefan Kühn.15.10.2015
- Die neue Landing Page der data2day 2016 ist online. Jetzt schon mal das Datum notieren. Der Call for Papers startet im März 2016.14.10.2015
Gold-Sponsor
Silber-Sponsoren
Bronze-Sponsoren
Veranstalter
Unser Konferenz-Portfolio

Eine Reise durch den Dschungel skalierbarer Machine-Learning-Systeme

// Referent

// Tobias Herb

Kontakt

Unser Konferenz-Portfolio

Impressum

Bilder von der Konferenz