Mining Stream Data mit Apache Kafka

In Big-Data-Projekten sind Daten oftmals ein nicht endender Datenstrom. Auf diesen Datenströmen reicht es meist nicht aus, vorab erlernte Machine-Learning-Modelle anzuwenden, um die richtigen Entscheidungen zu treffen.

Auch benötigen die meisten ML-Verfahren immer alle Daten als Eingabe, um beispielsweise Entscheidungsbäume erfolgreich zu erlernen. Diese Offline-Verfahren können nicht in Echtzeit und mit hoher Geschwindigkeit direkt auf Datenströmen lernen.

In diesem Vortrag zeigen wir, wie mit Kafka Streams Entscheidungsbäume inkrementell auf Datenströmen erlernt und angewendet werden können. Der vorgestellte Ansatz lässt sich auch auf weitere Stream-Learning-Verfahren anwenden.

Vorkenntnisse

Interesse an den Themen Kafka, Datenströme und Machine Learning.

Lernziele

Es wird ein Verfahren vorgestellt, das es ermöglicht, Stream Learning mit Apache Kafka Streams effizient zu implementieren.

 

Speaker

 

Alexander Albrecht
Alexander Albrecht ist Mitgründer von bakdata. Für das Management, die Integration und die Analyse von heterogenen Daten erarbeitet er maßgeschneiderte Software-Lösungen. Dazu zählen u.a. datenorientierte Anwendungsentwicklung, Data Warehousing, Big Data sowie Data Science. Das Know-how dafür hat er durch zahlreiche Industrie- und Forschungsprojekte erworben.

Gold-Sponsoren

HMS
Structr

Silber-Sponsoren

codecentric
Phytec

Bronze-Sponsor

incontext.technology GmbH

data2day-Newsletter

Sie möchten über die data2day
auf dem Laufenden gehalten werden?

 

Anmelden