Datenanalyse mit Machine Learning

In diesem Workshop führen wir ein Analyseprojekt durch und nutzen dazu unterschiedliche Methoden.

Basis bilden unstrukturierte Daten aus dem Technology-Subreddit, die wir zunächst statistisch analysieren. Anschließend werden wir die Datenmenge mittels Klassifikation einengen und versuchen, die Inhalte genauer zu verstehen. Dazu kommt Topic Modeling als unüberwachtes Machine Learning im Bereich NLP zum Einsatz.

Schließlich werden wir die Sentiments mit LLMs bestimmen. Daraus ergeben sich Zeitserien, die wir analysieren die zukünftige Entwicklung mit unterschiedlichen Methoden vorhersagen.

Vorkenntnisse

Python wäre hilfreich, muss aber nicht unbedingt sein
Wer seinen eigenen Computer nutzen will, sollte Jupyter installieren, es geht aber auch mit Colab.

Lernziele

  • Kennenlernen unterschiedlicher Datenanalysemethoden
  • Überwachtes und unüberwachtes Machine Learning
  • LLMs und Transformer
  • Zeitserien-Vorhersagen
  • Projektablauf in komplexen Analyseprojekten kennenlernen

Agenda

Pausenzeiten
  • ab 09:00 Uhr: Registrierung und Begrüßungskaffee
  • 10:00 Uhr: Beginn
  • 12:30 - 13:30 Uhr: Mittagspause
  • 15:00 - 15:15 Uhr: Kaffeepause
  • 16:15 - 16:30 Uhr: Kaffeepause
  • ca. 17:00 Uhr: Ende

 

Technische Anforderungen

Laptop (mit Python/Jupyter oder alternativ Google Colab)

Speaker

 

Christian Winkler
Christian Winkler beschäftigt sich seit vielen Jahre mit künstlicher Intelligenz, speziell in der automatisierten Analyse natürlichsprachiger Texte (NLP). Als Professor an der TH Nürnberg konzentriert sich seine Forschung auf die Optimierung von User Experience mithilfe moderner Verfahren. Er forscht und publiziert zu AI/NLP und ist regelmäßig Sprecher auf Konferenzen.

data2day-Newsletter

Ihr möchtet über die data2day
auf dem Laufenden gehalten werden?

 

Anmelden