Skalierbare Datenanalyse mit IPython

Das Python-basierte Open-Source-Ökosystem rund um IPython, Jupyter, Numpy, Pandas, Matplotlib usw. hat sich in den letzten Jahren in der Data-Science-Comunity fest etabliert. Mit der neusten Version von IPython lassen sich nun mit IPython.parallel auch recht einfach skalierbare verteilte Anwendungen realisieren.

Der Vortrag gibt eine kurze Einführung in die IPython-Welt und zeigt dann anhand von Beispielen, wie sich eine Skalierung von Muti-Core-Systemen über die Cloud bis hin zu HPC-Clustern umsetzen lässt. Dabei werden insbesondere die Vorteile von IPythons Fähigkeit zur Umsetzung asynchroner Kommunikationsmodelle betrachtet und die Vor- und Nachteile gegenüber Python-Lösungen mit Hadoop und Spark diskutiert.

Skills
Grundlagen in den Python-Tools (IPython, Numpy, Scipy, Matplotlib, Pandas ...) sind von Vorteil, aber nicht zwingend.

Lernziele
Ziel ist es zu zeigen, wie einfach mit IPython skalierbare Big-Data-Anwendungen in die die Cloud gebracht werden können. Dies soll anhand mehrerer Use-Cases demonstriert und die Vor- und Nachteile gegenüber Hadoop/Spark-Lösungen diskutiert werden. Als Resultat sollen Zuhörer in der Lage sein abzuschätzen, ob sich IPython.parallel für ihre Projekte eignen könnte. Die Vorteile asynchroner Kommunikationsmodelle sollen verdeutlicht werden.

// Referent

// Janis Keuper
@JanisKeuper

ist Senior Researcher am Competence Center High Performance Computing des Fraunhofer ITWM in Kaiserslautern. Neben wissenschaftlichen Fragestellungen aus dem Bereich Large Scale Machine Learning beschäftigt er sich auch mit skalierbaren Ansätzen zur Analyse und Modellierung große Datenmengen.

News
- Wir wünschen unseren rund 240 Teilnehmern eine gute Anreise!03.10.2016
- Jetzt steht unser Gold-Sponsor fest: inovex! Herzlich Willkommen.30.08.2016
+ / -
- Mit etwas mehr als 220 Teilnehmern ist die data2day nun frühzeitig ausverkauft.29.08.2016
- Wir richten am 6. Oktober mit codecentric das data2day Meetup aus.24.08.2016
- Wir haben bereits heute die Teilnehmerzahl des Vorjahres erreicht!16.08.2016
- Das Programm der data2day steht nun online. Damit verbunden kann man sich ab sofort für die Konferenz registrieren.05.07.2016
- Die Verlängerung des CfP hat gefruchtet. Knapp 80 Einreichungen versprechen eine spannende Auswahl.17.05.2016
- Es gab zu viele Bitten, den CfP zu verlängern. Deswegen ist der neue Termin dafür der 16. Mai, also in genau einer Woche.09.05.2016
- Noch bis nächsten Montag können Sie Vorschläge und Workshops vorschlagen.02.05.2016
- Wer sich sein Ticket für die data2day im Oktober schon sichern möchte, kann dies jetzt online tun.29.04.2016
- Ab sofort kann man sich für die nächste Ausgabe der data2day mit einem Vortrag oder Workshop bewerben.16.02.2016
- Einen sehr wohlwollenden Rückblick auf die data2day 2015 vermittelt der Konferenzbericht von Stefan Kühn.15.10.2015
- Die neue Landing Page der data2day 2016 ist online. Jetzt schon mal das Datum notieren. Der Call for Papers startet im März 2016.14.10.2015
Gold-Sponsor
Silber-Sponsoren
Bronze-Sponsoren
Veranstalter
Unser Konferenz-Portfolio

Skalierbare Datenanalyse mit IPython

// Referent

// Janis Keuper
@JanisKeuper

Kontakt

Unser Konferenz-Portfolio

Impressum

Bilder von der Konferenz

Skalierbare Datenanalyse mit IPython

// Referent

// Janis Keuper @JanisKeuper

// Janis Keuper
@JanisKeuper