Posts Tagged ‘Big Data’

Datascience on Apache Spark

Apache Spark™ ist ein Werkzeug zur Verarbeitung und Analyse von großen Datenmengen.

Üblicherweise kommt in Big Data Szenarien, die auf Apache Spark™ laufen, schnell der Wunsch auf, diese großen Datenmengen auch analysieren zu können. Ich habe mir für solche Aufgaben das Statistikpaket „R“ und eine spezielle Bibliothek angesehen, um herauszufinden, ob sich hiermit solche Aufgaben erledigen lassen.


High Performance Datenbanken für IoT Szenarien

Ich beschäftige mich derzeit auch privat mit der Frage, wie ich die vielen Daten auswerten und visualisieren kann, die in typischen Internet of Things Szenarien, oder bei der Hausautomatisierung vorkommen.

Dazu habe ich mir die freie, spaltenorientierte Datenbank Druid angesehen.


Big Data und High Performance Computing

Amazon hat sich mit seinen Webservices zu einem größeren Cloud Anbieter emporgearbeitet. Man kann dort z.B. Rechenressourcen mieten, um darauf eine ressourcenhungrige Anwendung laufen zu lassen.

Field Programmable Gate Arrays (FPGA) sind aufgrund ihrer Architektur sehr gut für das high Performance Computing geeignet. Amazon bietet nun solche FPGAs in der Cloud an, was besonders im Bereich der Analytics interessant ist.