DataLake, MapReduce & Spark, Véhicules Connectés

Bonjour à tous,

C’est au campus de l’IESEG, au cœur de la Grande Arche de La Défense que nous allons nous retrouver le Jeudi 4 Juin dès 18h00 pour le prochain Hadoop User Group. Au programme, modélisation du Data Lake, étude de cas Mappy sur le traitement de logs avec MapReduce et Spark et présentation du projet  « véhicules connectés » de PSA Peugeot Citroën ! 3 sujets autour d’Hadoop comme on les aime !

Talk 1. Les « Data Warehouse » et « Data Mart », leur modélisation en étoiles ou en flocons sont des concepts maîtrisés depuis longtemps. Ils sont la fondation des systèmes de Business Intelligence d’aujourd’hui. L’apparition d’Hadoop, sa capacité à stocker des données  non structurée sont à l’origine des  « Data Lake », réservoir où l’on stocke toutes les données de l’entreprise … avec la promesse d’en déduire de nouvelles opportunités de business. Peut-on appliquer, ou doit-on appliquer les mêmes concepts de modélisation avec Hadoop ? Ne faut-il pas tout remettre en cause ? Cyrille Coqueret , Directeur Technique Business Intelligence & Big Data de la société EDIS Consulting détaillera les bonnes pratiques à mettre en œuvre pour modéliser un « Data Lake »

Talk 2. Mappy, le service de cartographie et d’informations géolocalisées sur web et mobile qui permet de se déplacer facilement jusque dans nos commerces, tout le monde connait ! La société s’est lancée dans l’aventure Hadoop il y a deux ans pour gérer des centaines de giga de « logs » provenant de centaines de serveurs, contrôler leurs performances, leurs usages mais aussi identifier les nouveaux « points d’intérêt » des utilisateurs web. Florent Voignier, Architecte Big Data chez Databig et Nicolas Korchia, responsable Business Intelligence chez Mappy nous raconteront l’aventure technique par laquelle ils sont passés, de Hadoop 1 à Hadoop 2, Map Reduce vs Spark et les évaluations des différents outils SQL comme HBase/Phoenix, Impala et Tableau.

Talk 3. L’internet des objets est là. L’Airbus A350, équipé de 6.000 capteurs, génère 2,5 TB d’information par vol. Ces données sont ensuite analysées pour, entre autres, optimiser la consommation des moteurs. Plus proche de nous, la voiture de monsieur tout le monde sera bientôt connectée et dialoguera avec son environnement. Chez PSA Peugeot Citroën, autre fleuron industriel, on travaille sur les véhicules connectés dans l’optique d’améliorer sécurité, confort, maintenance préventive, gestion du trafic. On pensait que les Big Data étaient Big, nous n’avons certainement encore rien vu ! Michael Thiriet, Architecte Technique BI et Big Data chez PSA nous fera découvrir ce fabuleux projet.

Remarque: pour des raisons de sécurité, la liste des participants sera communiquée 24h avant l’événement à la Grande Arche. Merci d’indiquer un nom, prénom et une adresse email professionnelle valide lors de votre inscription meetup. Merci à ceux possédant déjà une fiche meetup de vérifier la cohérence des informations saisies. Inscriptions possibles jusqu’au 3 Juin, 17h.

Merci à la société EDIS Consulting, sponsor de l’événement et à l’IESEG School of Management de nous accueillir

Enregistrement à : http://www.meetup.com/Hadoop-User-Group-France/events/222610836/

About Cédric CARBONE

CoFounder @influans & @hugfrance⚡CTO @Talend 2006-2014⚡Board Member @NanoCloud & @OW2 FromDataToSales (targeted deals) : www.influans.com Turn any software into a cloud solution : www.nanocloud.com Twitter: @carbone
This entry was posted in meetup. Bookmark the permalink.

One Response to DataLake, MapReduce & Spark, Véhicules Connectés

  1. Vladislav Pernin says:

    Les slides des différentes présentations sont ils publiés quelque part ?

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>