Les dernières actualités du groupe Synaltic

Faire un job ETL avec Apache Spark (Partie 1)

job etl avec spark image de couverture

Apache Spark est un framework de data processing qui permet de traiter de gros volumes de données. Spark se charge de distribuer le calcul sur plusieurs machines en utilisant principalement les mémoires vives (RAM). Le projet a été initié par Matei Zaharia dans le  laboratoire AMPLAB de l’université de Berkeley en 2009 avant d’être confié à la fondation Apache. Matei est actuellement le CTO de Databricks, la société commerciale derrière Apache Spark.

Lire la suite

Tableau 10.4 – On débriefe la bêta !

tableau 10.4 beta debrief

Tableau 10.4 va bientôt arriver dans les bacs ! Et oui, la cadence de mise à jour des versions de Tableau s’étant accélérée depuis quelques temps, nous voyons naître tous les trimestres une nouvelle version de Tableau avec des nouveautés plus ou moins intéressantes, il faut l’avouer. Cette version 10.4 arrive donc à terme quelques 4 mois après la version 10.3. Tout ça c’est très bien mais qu’y a-t-il au menu ?! C’est ce que nous allons essayer de voir […]

Lire la suite

Conseils de pro pour réaliser de bons dashboards Tableau

Lorsque vous décidez de créer un dashboard Tableau, êtes-vous plutôt du genre à opter pour une mise en page fonctionnelle, priorité-à-l’info-le-fond-prime-sur-la-forme, ou plutôt du genre à laisser libre court à votre fibre artistique ?  D’après Andy Cotgreave, évangéliste Tableau, pour une bonne dataviz, rien ne vaut un savant mélange des deux !

Lire la suite

Mieux comprendre la GDPR

GDPR data protection illustration marteau juge

Dans environ un an, le 25 mai 2018 entrera en vigueur la loi européenne de protection des données personnelles, la General Data Protection Regulation ou « GDPR ». Essayons d’y voir plus clair…

Lire la suite

Talend Connect 2017

Comme tous les ans, nous sommes allés passer la journée avec les utilisateurs Talend de toute l’Europe lors du Talend Connect 2017.

Lire la suite