Veröffentlichungen

K-means with KDD'99 data set

Mit Hilfe von K-means und dem KDD'99 Datensatz haben wir die optimale Anzahl an Clustern bestimmt, um Angriffe zu identifizieren. Den Quellcode und das Ergebnis findet ihr unter folgenden GitLab Link:

Large Scale Distributed Graph Processing on Flink and Spark

Graphs havebecome really important in today’s social media society to store connections between several objects. Because modern graphs can get pretty big, several Graph Processing Frameworks has been developed.This paper takesa look behind the graph processing API’s of the Distributed Dataflow Systems Apache Flink and Spark.