Web Scraping für ML-Projekte: Was ihr dürft, was ihr lasst und wo es teuer wird
Fast jedes ML-Projekt beginnt mit der Frage: Woher kommen die Daten? Und oft lautet die Antwort: aus dem Web. Aber Web Scraping ist rechtlich deutlich komplizierter, als viele denken. Es geht um Urheberrecht, Datenschutz, Datenbankschutz und die Nutzungsbedingungen der Quellseiten — und die Gerichte werden hier gerade sehr aktiv.
Unsere Kanzlei vertritt im wichtigsten deutschen Verfahren zu KI-Trainingsdaten (LAION vor dem BGH) eine der Parteien und kann aus erster Hand berichten, wo die roten Linien verlaufen.
Am Ende habt ihr einen klaren Fahrplan: Was geht, was geht nicht, und wie dokumentiert ihr eure Datenbeschaffung so, dass ihr im Ernstfall auf der sicheren Seite seid.