Spark Meetup chez AXA le lundi 07 décembre 2015

Bonjour à tous,

Nous avons le plaisir de vous inviter au Spark meetup le lundi 07 décembre 2015 chez AXA (25 avenue Matignon 75008 Paris) à 18h30.

*** Attention, il est indispensable de renseigner votre Nom Prenom et email pour valider votre inscription! De plus, merci de ne pas utiliser de caractères accentuées pour votre nom et prénom, merci. ***

Les inscriptions pour ce meetup seront ouvertes à partir de mardi 1er décembre.

Un agenda chargé et intéressant vous attend pour ce meetup:

• 6h30-6h45 Welcome

• 6h45-7:15 : Record Linkage, un cas d’utilisation en Spark ML par Alexis Seigneurin

Le Record Linkage est le process qui consiste à trouver, dans un data set, les enregistrements qui représentent la même entité. Cette opération est particulièrement compliquée quand, comme nous, vous travaillez avec des données anonymisées. C’est là que le Machine Learning vient en renfort !Nous avons implémenté un algorithme de Record Linkage en Spark SQL (DataFrames) et Spark ML plutôt que d’utiliser des règles statiques. Nous verrons le process de Feature Engineering, pourquoi nous avons dû étendre Spark DataFrames pour préserver des méta-données au travers du pipeline de traitement, et comment nous avons utilisé le Machine Learning pour réconcilier les enregistrements. Nous verrons enfin comment nous avons industrialisé cette application.

Alexis Seigneurin : Développeur depuis 15 ans, j’attache beaucoup d’importance aux problématiques de traitement, d’analyse et de stockage de la donnée.Chez Ippon, j’interviens principalement sur des missions de conseil et d’architecture autour de technologies big data. Par ailleurs, j’anime la formation Spark chez Ippon.

• 7h15-7h45 : Datalab 101 (Hadoop, Spark, ElasticSearch) par Jonathan Winandy

Retour d’expérience sur la mise en place d’un Datalab avec Hadoop, Spark et ElasticSearch dans un environnement contraint. Nous allons exposer les méthodes qui nous ont permis d’améliorer la conception, le développement, les performances et la recette d’une application complexe en Spark.

Jonathan Winandy est MOE, développeur Java/Scala spécialisé dans les pipelines de données.

• 7h45-8h15 : Apache Zeppelin, un notebook d’avenir pour l’éco-système par DuyHai Doan

Spark et Cassandra sont des projets très populaires, mais avez vous entendu parler d’Apache Zeppelin ? Zeppelin propose un système de notebook pour pouvoir manipuler les données de manière interactive. Zeppelin repose sur un système de plugins qui permet de traiter des tâches Spark, des requêtes Spark SQL mais aussi des requêtes CQL de Cassandra. Je montrerai comment construire un pipeline de transformation BigData en mélangeant du Spark, du Cassandra, du Shell, du Markdown, du ce-que-vous-voulez etc.

Duy Hai est évangéliste technique pour Datastax, l’entreprise commerciale derrière Apache Cassandra. Il partage son temps entre donner des présentations/meetups/talks sur Cassandra, développer sur des projets open-source pour la communauté et aider les projets utilisant Cassandra. Avant Datastax, Duy Hai a été développeur freelance Java/Cassandra.

• 8:15-8:45 : Démarrer rapidement avec Apache Flink par Bilal Baltagi

-Comment installer Apache Flink sur votre PC ou Mac et comment se familiariser avec CLI, Job Client Web interface et Job Manager Web Interface?
-Comment développer une application Big Data en Java / Scala en utilisant un IDE?
-Comment développer avec Apache Flink en mode interactif avec Flink Shell ou Zeppelin Notebook (Scala)?

Bilal Baltagi a obtenu un master en analyse des données à l’Université Paris Nord – Paris 13. Il est actuellement consultant décisionnel chez Sarenza à Paris. Il intervient sur toutes les phases d’un projet décisionnel et Big data: recueil des besoins, conceptions, réalisations et accompagnement des utilisateurs. Bilal est de plus en plus intéressé à l’intersection de la Big Data avec la Business Intelligence et aime jouer avec Apache Flink!

• 8:45-10:30 : networking

Merci de vous enregistrer sur meetup (http://www.meetup.com/Paris-Spark-Meetup/events/226967800/) à partir du mardi 1er decembre afin que l’on puisse s’assurer du bon déroulement logistique.

Un grand merci à AXA pour nous prêter leur salle et s’occuper de l’apéritif dinatoire.

Merci AXA

L’équipe HUG France

http://hugfrance.fr

@hugfrance

About Cédric CARBONE

CoFounder @influans & @hugfrance⚡CTO @Talend 2006-2014⚡Board Member @NanoCloud & @OW2 FromDataToSales (targeted deals) : www.influans.com Turn any software into a cloud solution : www.nanocloud.com Twitter: @carbone
This entry was posted in meetup. Bookmark the permalink.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>