Datascience on Apache Spark
Apache Spark™ ist ein Werkzeug zur Verarbeitung und Analyse von großen Datenmengen.
Üblicherweise kommt in Big Data Szenarien, die auf Apache Spark™ laufen, schnell der Wunsch auf, diese großen Datenmengen auch analysieren zu können. Ich habe mir für solche Aufgaben das Statistikpaket „R“ und eine spezielle Bibliothek angesehen, um herauszufinden, ob sich hiermit solche Aufgaben erledigen lassen.
High Performance Datenbanken für IoT Szenarien
Ich beschäftige mich derzeit auch privat mit der Frage, wie ich die vielen Daten auswerten und visualisieren kann, die in typischen Internet of Things Szenarien, oder bei der Hausautomatisierung vorkommen.
Dazu habe ich mir die freie, spaltenorientierte Datenbank Druid angesehen.