Faire un job ETL avec Apache Spark (Partie 1)

job etl avec spark image de couverture

Apache Spark est un framework de data processing qui permet de traiter de gros volumes de données. Spark se charge de distribuer le calcul sur plusieurs machines en utilisant principalement les mémoires vives (RAM). Le projet a été initié par Matei Zaharia dans le  laboratoire AMPLAB de l’université de Berkeley en 2009 avant d’être confié à la fondation Apache. Matei est actuellement le CTO de Databricks, la société commerciale derrière Apache Spark.

Lire la suite

R&D | Gravitee.io, l’API Manager open source !

r&d test gravitee homepage

Une fois n’est pas coutume, notre cellule R&D est allée tester un outil qui lui a plu et a décidé de vous en parler ! Aujourd’hui, c’est Gravitee.io, API manager open source, qui est passé au crible par Charly Clairmont.

Lire la suite

La Business Intelligence, partout, tout le temps

nanocloud test synaltic r&d

Alors que la plupart des outils de business intelligence (ETL, reporting, OLAP) sont disponibles en mode clients lourds, l’avènement des interfaces web et du cloud va bientôt changer la donne ! L’équipe R&D de Synaltic a eu la chance de tester NanoCloud, une solution qui repose sur des briques open source et qui transforme les applications traditionnelles en solutions Saas, en les propulsant dans le cloud.

Lire la suite