Spark Meetup à la SG avec Cloudera, Xebia et Influans le jeudi 11 juin

Bonjour à tous,

Nous avons le plaisir de vous inviter au Spark meetup le jeudi 11 juin à la SGCIB (Cours Valmy à La Defense) à 19h00.

Au programme, trois sessions suivies d’un apéro networking.

• 19h00-19h15 : Accueil des participants, planning de la soirée

• 19h15-20h00 : Sean Owen (www.cloudera.com) : A taste of random decision forests on Apache Spark

Apache Spark has a lot to like for the data scientist: natively distributed, REPL, Scala and Python APIs, and a machine learning library, MLlib. Spark 1.2 includes an implementation of random decision forests, an important classifier/regressor algorithm. This talk will introduce Spark, Scala, and random decision forests, and demonstrate the process of analyzing a real-world data set with them.

• 20h00-20h30 : Matthieu Blanc & Julien Buret (www.xebia.fr) : Spark Dataframe et Spark ML

La dernière version de Spark nous apporte une nouvelle API inspirée des librairies et langage d’analyse statistique. Nous verrons comment Spark Dataframe nous permet de simplement manipuler et explorer les données en conservant la scalabilité de Spark RDD.

Dans un second temps, Matthieu Blanc présentera spark.ml. En effet, la version 1.2 de Spark a introduit ce nouveau package qui fournit une API de haut niveau permettant la création de pipeline de machine learning. Nous verrons ensemble les concepts de base de cet API à travers un exemple.

• 20h30-21h00 : Bertrand Dechoux (www.influans.com) :  Search as recommendation

Recherche full-text et recommandation, deux mondes à part? Nous verrons qu’il est possible de marier Lucene (Elastic Search/Solr) et filtrage collaboratif afin de produire un système de recommandation flexible et scalable. Cela passera par un aperçu des dernières sorties : la plateforme Confluent (Kafka) ainsi que Mahout 0.10 (avec Samsara).

• 21h00-… : Apéro networking

Merci de vous enregistrer à http://www.meetup.com/Paris-Spark-Meetup/events/222607538/  afin que l’on puisse s’assurer du bon déroulement logistique. Une carte d’identité sera demandée à l’entrée de la SGCIB.

Un grand merci à la Société Générale et à Xebia pour nous aider dans l’organisation de ce meeting et nous prêter leur salle.

About Cédric CARBONE

CoFounder @influans & @hugfrance⚡CTO @Talend 2006-2014⚡Board Member @NanoCloud & @OW2 FromDataToSales (targeted deals) : www.influans.com Turn any software into a cloud solution : www.nanocloud.com Twitter: @carbone
This entry was posted in meetup. Bookmark the permalink.

One Response to Spark Meetup à la SG avec Cloudera, Xebia et Influans le jeudi 11 juin

  1. Les présentations de jeudi soir arrivent petit à petit:

    #Sean Owen (www.cloudera.com) : A taste of random decision forests on Apache Spark
    https://docs.google.com/file/d/0B_hfrkaWlLi4OXNMZ1Bfa1l6eWs/edit?usp=docslist_api

    #Julien Buret (www.xebia.fr) : Spark Dataframe
    http://www.slideshare.net/hugfrance/spark-dataframe

    #Matthieu Blanc (www.xebia.fr) : Spark ML
    http://www.slideshare.net/hugfrance/spark-ml-2-169

    #Bertrand Dechoux (www.influans.com) : Search as recommendation
    http://www.slideshare.net/hugfrance/june-spark-meetup-search-as-recommandation

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>