Hadoop Meetup chez Logmatic/Ikoula (HUG)

Bonjour à tous,

Nous avons le plaisir de vous inviter au Hadoop User Group le mardi 16 février 2016 chez Logmatic (130 Rue de Lourmel, 75015, Paris).

*** Attention, il est indispensable de renseigner votre Nom Prenom et email pour valider votre inscription! De plus, merci de ne pas utiliser de caractères accentuées pour votre nom et prénom, merci. ***

Les inscriptions pour ce meetup seront ouvertes à partir de mercredi 10 février 2016.

Les présentations débuteront à 19h suivies d’une 3e mi-temps qui nous permettra de continuer les discussions dans la bonne humeur.

Un agenda intéressant vous attend pour ce meetup:

• 18h30-19h : Accueil des participants, planning de la soirée

• 19h00-19h15 : Welcome message

19h15-19h45 : Migration de données structurées entre Hadoop et RDBMS par Louis Rabiet (Squid Solution)
Avec l’extraction de données stockées dans une base de données relationnelle à l’aide d’un outil de BI avancé, et avec l’envoi via Kafka des données vers Tachyon, plusieurs sessions Spark peuvent travailler sur le même dataset en limitant la duplication. On obtient grâce à cela une communication à coût contrôlé entre la base de données d’origine et Spark ce qui permet de réintroduire de manière dynamique les données modifiées avec MLlib tout en travaillant sur des données à jour. Les résultats préliminaires seront partagés durant cette présentation.

19h45-20h15 : Système de recommandations de produits sur un site marchand par Koby KARP, Data Scientist (Equancy) & Hervé MIGNOT, Partner at Equancy
La recommandation reste un outil clé pour la personnalisation des sites marchands et le sujet est loin d’être épuisé. La prise en compte de la particularité d’un marché peut nécessité d’adapter le traitement et les algorithmes utilisés. Après une revue des techniques de recommandations, nous présenterons la démarche spécifique que nous avons adopté. Le système a été développé sous Spark pour la préparation des données et le calcul des modèles de recommandations. Une API simple et son service ont été développé pour délivrer les recommandations aux applications clientes.

20h15-20h45 :Cloud et programmation parallèle pour le big data : benchmarks sur un régresseur par Christopher Bourez (Axa Global Direct)
L’objet de cette présentation est l’utilisation du cloud et des technologies de calcul parallèle pour l’estimation d’un régresseur sur une forte volumétrie de données. Des benchmarks sont réalisés sur plusieurs configuration hardware, allant de 1 instance à un cluster de 100 instances. Est présentée l’utilisation de ressources et clusters temporaires dans le cloud.
Christopher Bourez, développeur & manager expert en systèmes d’information modernes chez Axa Global Direct. Alien thinker. Blog : http://christopher5106.github.io/

• 20h45-21h30 : Apéro networking

Merci de vous enregistrer sur meetup (http://www.meetup.com/Hadoop-User-Group-France/events/227736302/) afin que l’on puisse s’assurer du bon déroulement logistique.

Un grand merci à Ikoula et logmatic.io pour nous prêter leur salle et s’occuper de l’apéritif dinatoire.

L’équipe HUG France

http://hugfrance.fr

@hugfrance

Posted in meetup | Leave a comment

Hadoop Meetup Chez Canal+ le 14/01/2016 ( HBase / Spark-Riak / Industrialisation)

Bonjour à tous,

Nous avons le plaisir de vous inviter au Hadoop User Group le jeudi 14 janvier 2016 chez Canal+ (Bâtiment Lumière, 5 Boulevard de la République, 92100 Boulogne-Billancourt).

*** Attention, il est indispensable de renseigner votre Nom Prenom et email pour valider votre inscription! De plus, merci de ne pas utiliser de caractères accentuées pour votre nom et prénom, merci. (Inscription à http://www.meetup.com/Hadoop-User-Group-France/events/227736302/) ***

Les inscriptions pour ce meetup seront ouvertes à partir de lundi 11 janvier 2016.

Les présentations débuteront à 19h suivies d’une 3e mi-temps qui nous permettra de continuer les discussions dans la bonne humeur.

Un agenda chargé et intéressant vous attend pour ce meetup:

• 18h30-19h : Accueil des participants, planning de la soirée
• 19h00-19h15 : Welcome message
• 19h15-19h45 : Industrialisation des processus Big Data chez CANAL+ par Stephen CLAIRVILLE (CanalPlus)
L’intégration de la brique technique Big Data au sein d’une architecture décisionnelle déjà existante. Retour d’expérience sur les développements réalisés afin de faciliter l’intégration, la supervision, et l’exploitation des flux Hadoop dans notre écosystème décisionnel / présentation de la phase préparatoire de la mise à disposition des données aux data analysts et data scientists.
Pascal PERISSEAU, responsable technique du pôle décisionnel et Big Data chez CANAL+ depuis 10 ans
Stephen CLAIRVILLE, chef de projet tech. lead Big Data depuis 2 ans chez CANAL+

• 19h45-20h15 : L’approche Model as Code par Benoit Grossin (EDF-R&D) et Matthieu Vautrot (Quantmetry)
La mise en production de modèles est une étape charnière du cycle de vie d’un projet Data Science mené au sein d’une entreprise.
On observe que cette partie est encore rarement industrialisée alors qu’elle est indispensable pour l’exploitation continue des résultats des modèles.
Lorsque qu’un modèle finalisé présente un pouvoir prédictif satisfaisant en phase de développement, l’industrialisation de sa mise en production permet de le déployer et de l’exploiter de manière continue et automatique et ce, en minimisant la charge de travail.
Notre intervention présentera notre retour d’expérience dans le contexte EDF sur la mise en place d’une approche capable de raccourcir voire d’annuler le temps de mise en production dans un environnement Hadoop et plus particulièrement Hive.
Benoit Grossin est Ingénieur de Recherche chez EDF-R&D ICAM
Matthieu Vautrot est Consultant Analytics & Big Data chez Quantmetry

• 20h15-20h45 : HBase in Financial Industry par Pierre Bittner (Scaled Risk CTO)
Le traitement et l’analyse de grand volume de données sont au cœur des activités des banques. Bon nombre d’acteurs des marchés financiers ont déjà adopté Hadoop sur de nombreux cas d’usage : gestion des risques, identification des opportunités commerciales, détection de fraude, surveillance des marchés…
Une incroyable diversité de format doit être gérée. De ce point de vue, HBase est un choix naturel de base de données distribuée grâce à son modèle de donnée dynamique.
Après une présentation générale des caractéristiques d’HBase, ce talk présente comment modéliser les informations traitées pour s’adapter à différents contextes d’utilisation.
Pierre Bittner est le CTO de Scaled Risk, éditeur d’une plateforme Big Data dédiée aux institutions financières. Scaled Risk est bâtie sur HBase. Pierre intervient depuis 10 ans sur les SI bancaires.

• 20h45-21h15 : L’analytique temps réel avec Riak et Spark par Michael Carney (Basho) et Olivier Girardot de Lateral Thoughts
Selon un rapport de Salesforce, le nombre de sources de données analysées par les entreprises progressera de 83% au cours des cinq prochaines années, ainsi les organisations veulent désormais fournir des connaissances en temps réel même sur les appareils mobiles. Le traitement temps réel est donc, le futur de l’analyse big data.
Ce talk présentera des nouveautés en matière de l’analyse temps réel autour de la famille SGBD Riak et Spark.
Michael Carney est le Directeur Commercial de Basho pour le Sud d’Europe. Fondateur de MySQL France et de MariaDB, Michael a rejoint Basho en janvier 2015 pour explorer le monde de données sans tables !
Olivier Girardot est le CTO de Lateral Thoughts, il est développeur et formateur au sujet de Spark et également spécialiste de Java/Python dans le domaine de la finance de marché.

• 21h15-22h00 : Apéro networking

Merci de vous enregistrer sur meetup (http://www.meetup.com/Hadoop-User-Group-France/events/227736302/) afin que l’on puisse s’assurer du bon déroulement logistique.

Un grand merci à Canal+ pour nous prêter leur salle et s’occuper de l’apéritif dinatoire.
L’équipe HUG France

http://hugfrance.fr

@hugfrance

Posted in meetup | Leave a comment

Spark Meetup chez AXA le lundi 07 décembre 2015

Bonjour à tous,

Nous avons le plaisir de vous inviter au Spark meetup le lundi 07 décembre 2015 chez AXA (25 avenue Matignon 75008 Paris) à 18h30.

*** Attention, il est indispensable de renseigner votre Nom Prenom et email pour valider votre inscription! De plus, merci de ne pas utiliser de caractères accentuées pour votre nom et prénom, merci. ***

Les inscriptions pour ce meetup seront ouvertes à partir de mardi 1er décembre.

Un agenda chargé et intéressant vous attend pour ce meetup:

• 6h30-6h45 Welcome

• 6h45-7:15 : Record Linkage, un cas d’utilisation en Spark ML par Alexis Seigneurin

Le Record Linkage est le process qui consiste à trouver, dans un data set, les enregistrements qui représentent la même entité. Cette opération est particulièrement compliquée quand, comme nous, vous travaillez avec des données anonymisées. C’est là que le Machine Learning vient en renfort !Nous avons implémenté un algorithme de Record Linkage en Spark SQL (DataFrames) et Spark ML plutôt que d’utiliser des règles statiques. Nous verrons le process de Feature Engineering, pourquoi nous avons dû étendre Spark DataFrames pour préserver des méta-données au travers du pipeline de traitement, et comment nous avons utilisé le Machine Learning pour réconcilier les enregistrements. Nous verrons enfin comment nous avons industrialisé cette application.

Alexis Seigneurin : Développeur depuis 15 ans, j’attache beaucoup d’importance aux problématiques de traitement, d’analyse et de stockage de la donnée.Chez Ippon, j’interviens principalement sur des missions de conseil et d’architecture autour de technologies big data. Par ailleurs, j’anime la formation Spark chez Ippon.

• 7h15-7h45 : Datalab 101 (Hadoop, Spark, ElasticSearch) par Jonathan Winandy

Retour d’expérience sur la mise en place d’un Datalab avec Hadoop, Spark et ElasticSearch dans un environnement contraint. Nous allons exposer les méthodes qui nous ont permis d’améliorer la conception, le développement, les performances et la recette d’une application complexe en Spark.

Jonathan Winandy est MOE, développeur Java/Scala spécialisé dans les pipelines de données.

• 7h45-8h15 : Apache Zeppelin, un notebook d’avenir pour l’éco-système par DuyHai Doan

Spark et Cassandra sont des projets très populaires, mais avez vous entendu parler d’Apache Zeppelin ? Zeppelin propose un système de notebook pour pouvoir manipuler les données de manière interactive. Zeppelin repose sur un système de plugins qui permet de traiter des tâches Spark, des requêtes Spark SQL mais aussi des requêtes CQL de Cassandra. Je montrerai comment construire un pipeline de transformation BigData en mélangeant du Spark, du Cassandra, du Shell, du Markdown, du ce-que-vous-voulez etc.

Duy Hai est évangéliste technique pour Datastax, l’entreprise commerciale derrière Apache Cassandra. Il partage son temps entre donner des présentations/meetups/talks sur Cassandra, développer sur des projets open-source pour la communauté et aider les projets utilisant Cassandra. Avant Datastax, Duy Hai a été développeur freelance Java/Cassandra.

• 8:15-8:45 : Démarrer rapidement avec Apache Flink par Bilal Baltagi

-Comment installer Apache Flink sur votre PC ou Mac et comment se familiariser avec CLI, Job Client Web interface et Job Manager Web Interface?
-Comment développer une application Big Data en Java / Scala en utilisant un IDE?
-Comment développer avec Apache Flink en mode interactif avec Flink Shell ou Zeppelin Notebook (Scala)?

Bilal Baltagi a obtenu un master en analyse des données à l’Université Paris Nord – Paris 13. Il est actuellement consultant décisionnel chez Sarenza à Paris. Il intervient sur toutes les phases d’un projet décisionnel et Big data: recueil des besoins, conceptions, réalisations et accompagnement des utilisateurs. Bilal est de plus en plus intéressé à l’intersection de la Big Data avec la Business Intelligence et aime jouer avec Apache Flink!

• 8:45-10:30 : networking

Merci de vous enregistrer sur meetup (http://www.meetup.com/Paris-Spark-Meetup/events/226967800/) à partir du mardi 1er decembre afin que l’on puisse s’assurer du bon déroulement logistique.

Un grand merci à AXA pour nous prêter leur salle et s’occuper de l’apéritif dinatoire.

Merci AXA

L’équipe HUG France

http://hugfrance.fr

@hugfrance

Posted in meetup | Leave a comment

Spark Meetup chez Google avec Databricks et IBM le lundi 26 octobre 2015

Bonjour à tous,

Nous avons le plaisir de vous inviter au Spark meetup le lundi 26 octobre chez Google (8 rue de Londres à Paris) à 18h00.
Nous aurons le plaisir d’avoir 3 supers speakers dont certains venus des US pour vous parler des dernières nouveautés autour de Spark.

• 6h-6h15 Welcome

• 6:15-6:45 : Google Dataproc by Sébastien Agnan, Cloud Platform Sales Engineer at Google and Vincent Heuschling, General Manager of AffiniTechThanks!

Google Cloud Dataproc is a managed Hadoop MapReduce, Spark, Pig, and Hive service https://cloud.google.com/dataproc/

Sébastien Agnan a rejoint Google for Work en 2012 et assume aujourd’hui la responsabilité technique de l’offre Google Cloud Platform (IaaS/PaaS/Big Data) pour l’Europe du Sud. Spécialiste des architectures Cloud, il accompagne les clients Google for Work pour concevoir des solutions innovantes, en exploitant les nouvelles technologies et architectures Cloud comme le BigData, les backend mobiles, le Real Time Bidding, … Sébastien, diplômé de l’ESEO, avec une spécialisation en architecture des systèmes d’information, était architecte puis avant ventes chez ORACLE, avant de rejoindre Google.

Vincent Heuschling is the founder of Affini-Tech a company dedicated to Bigdata solutions. He leads a team of data-engineers to help his customer to build their Bigdata Platforms. As a Google Cloud partner, Affini-tech use the Google Cloud Platform every day to run bigdata solutions like Hadoop, Spark, and Cassandra.

• 6h45-7:30 : Deep dive into Project Tungsten: Bring Spark closer to bare metal by Reynold Xin, Co-Founder of Databricks, key Spark Committer

Project Tungsten focuses on substantially improving the efficiency of memory and CPU for Spark applications, to push performance closer to the limits of modern hardware.
This effort includes three initiatives:
1. Code generation: using code generation to exploit modern compilers and CPUs
2. Cache-aware computation: algorithms and data structures to exploit memory hierarchy
3. Memory Management and Binary Processing: leveraging application semantics to manage memory explicitly and eliminate the overhead of JVM object model and garbage collection
Project Tungsten will be the largest change to Spark’s execution engine since the project’s inception. In this talk, we will give an update on its progress and dive into some of the technical challenges we are solving.

Reynold Xin is a committer and PMC member of Apache Spark. He is also a co-founder of Databricks and oversees architectural directions for Spark. Before Databricks, he was pursuing a Ph.D. in the University of California-Berkeley AMPLab, where Spark was born.

• 7:30-8:15 : Spark after dark by Chris Fregly, Principal Data Solutions Engineer at IBM Spark Technology Center in San Francisco

Combining the most popular and technically-deep material from his wildly popular Advanced Apache Spark Meetup, Chris Fregly will provide a code-level deep dive on the latest advancements within the Apache Spark Ecosystem including the following:
1) Spark SQL/DataFrames and the Data Sources API with Cassandra and ElasticSearch
2) Spark Streaming Performance Improvements with Kafka and Kinesis
3) Feature Engineering and Recommender Systems with MLlib/GraphX
4) Approximations and Probabilistic Data Structures with Spark and Twitter’s Algebird
5) Partition Pruning and Predicate Pushdowns with Parquet and ORC
6) Performance Tuning and Mechanical Sympathy with Project Tungsten
This talk features many interesting and audience-interactive demos – as well as code-level deep dives into many of the open source codebases mentioned above.

All code is available on Github at the following link: https://github.com/fluxcapacitor/pipeline/wiki.

In addition, all demos and tools are prepackaged into a Docker image and available for download on Docker Hub at the following link: https://hub.docker.com/r/fluxcapacitor/pipeline/

Chris Fregly is a Principal Data Solutions Engineer for the newly-formed IBM Spark Technology Center, an Apache Spark Contributor, a Netflix Open Source Committer, as well as the Organizer of the global Advanced Apache Spark Meetup and author of the upcoming book, Advanced Spark. Previously, Chris was a Data Solutions Engineer at Databricks and a Streaming Data Engineer at Netflix.
When Chris isn’t contributing to Spark and other open source projects, he’s creating book chapters, slides, and demos to share knowledge with his peers at meetups and conferences throughout the world.

• 8:15-9:30 : networking

Merci de vous enregistrer à http://www.meetup.com/Paris-Spark-Meetup/events/226170066/ afin que l’on puisse s’assurer du bon déroulement logistique.

Un grand merci à Google pour nous prêter leur salle et s’occuper de l’apéritif dinatoire.

L’équipe HUG France

http://hugfrance.fr

@hugfrance

Posted in meetup | Tagged | Leave a comment

Video / Slides du Spark meetup du 4 février chez Viadeo (avec DataStax, Influans, Talend)

• 19h-19h45 : Présentation de la technologie Spark et exemple de nouveaux cas métiers pouvant être traités par du BigData temps réel.
Cédric Carbone – Cofondateur d’Influans (@carbone).
-Spark vs Hadoop MapReduce
-Spark Streaming vs Storm
-Le Machine Learning avec Spark
-Use case métier : NextProductToBuy

• 19h45-20h : Extension de Spark (Tachyon / Spark JobServer).
Jonathan Lamiel – Talend Labs
-La mémoire partagée de Spark avec Tachyon
-Rendre Spark Interactif avec Spark JobServer

• 20h-21h : Big Data analytics with Spark & Cassandra,
DuyHai DOAN, Technical Advocate at DataStax (@doanduyhai).
Apache Spark is a general data processing framework which allows you perform data processing tasks in memory. Apache Cassandra is a highly available and massively scalable NoSQL data-store.
By combining Spark flexible API and Cassandra performance, we get an interesting combo for both real-time and batch processing.
During this talk we will highlight the tight integration between Spark & Cassandra and demonstrate some usages with live code demo.

Video du Spark meetup du 4 février chez Viadeo:

https://www.youtube.com/watch?v=u8BTjrviG6M

Posted in Uncategorized | Leave a comment

Video / Slides du meetup sur Spark du 11 juin à la SG (Cloudera, Influans, Xebia)

https://youtu.be/2twefLKkW0o

• 19h15-20h00 : Sean Owen (www.cloudera.com) : A taste of random decision forests on Apache Spark

Apache Spark has a lot to like for the data scientist: natively distributed, REPL, Scala and Python APIs, and a machine learning library, MLlib. Spark 1.2 includes an implementation of random decision forests, an important classifier/regressor algorithm. This talk will introduce Spark, Scala, and random decision forests, and demonstrate the process of analyzing a real-world data set with them.

• 20h00-20h30 : Matthieu Blanc & Julien Buret (www.xebia.fr) : Spark Dataframe et Spark ML

La dernière version de Spark nous apporte une nouvelle API inspirée des librairies et langage d’analyse statistique. Nous verrons comment Spark Dataframe nous permet de simplement manipuler et explorer les données en conservant la scalabilité de Spark RDD.

Dans un second temps, Matthieu Blanc présentera spark.ml. En effet, la version 1.2 de Spark a introduit ce nouveau package qui fournit une API de haut niveau permettant la création de pipeline de machine learning. Nous verrons ensemble les concepts de base de cet API à travers un exemple.

• 20h30-21h00 : Bertrand Dechoux (www.influans.com) : Search as recommendation

Recherche full-text et recommandation, deux mondes à part? Nous verrons qu’il est possible de marier Lucene (Elastic Search/Solr) et filtrage collaboratif afin de produire un système de recommandation flexible et scalable. Cela passera par un aperçu des dernières sorties : la plateforme Confluent (Kafka) ainsi que Mahout 0.10 (avec Samsara).

• 21h00-… : Apéro networking

Posted in Uncategorized | Leave a comment

Spark Meetup à la SG avec Cloudera, Xebia et Influans le jeudi 11 juin

Bonjour à tous,

Nous avons le plaisir de vous inviter au Spark meetup le jeudi 11 juin à la SGCIB (Cours Valmy à La Defense) à 19h00.

Au programme, trois sessions suivies d’un apéro networking.

• 19h00-19h15 : Accueil des participants, planning de la soirée

• 19h15-20h00 : Sean Owen (www.cloudera.com) : A taste of random decision forests on Apache Spark

Apache Spark has a lot to like for the data scientist: natively distributed, REPL, Scala and Python APIs, and a machine learning library, MLlib. Spark 1.2 includes an implementation of random decision forests, an important classifier/regressor algorithm. This talk will introduce Spark, Scala, and random decision forests, and demonstrate the process of analyzing a real-world data set with them.

• 20h00-20h30 : Matthieu Blanc & Julien Buret (www.xebia.fr) : Spark Dataframe et Spark ML

La dernière version de Spark nous apporte une nouvelle API inspirée des librairies et langage d’analyse statistique. Nous verrons comment Spark Dataframe nous permet de simplement manipuler et explorer les données en conservant la scalabilité de Spark RDD.

Dans un second temps, Matthieu Blanc présentera spark.ml. En effet, la version 1.2 de Spark a introduit ce nouveau package qui fournit une API de haut niveau permettant la création de pipeline de machine learning. Nous verrons ensemble les concepts de base de cet API à travers un exemple.

• 20h30-21h00 : Bertrand Dechoux (www.influans.com) :  Search as recommendation

Recherche full-text et recommandation, deux mondes à part? Nous verrons qu’il est possible de marier Lucene (Elastic Search/Solr) et filtrage collaboratif afin de produire un système de recommandation flexible et scalable. Cela passera par un aperçu des dernières sorties : la plateforme Confluent (Kafka) ainsi que Mahout 0.10 (avec Samsara).

• 21h00-… : Apéro networking

Merci de vous enregistrer à http://www.meetup.com/Paris-Spark-Meetup/events/222607538/  afin que l’on puisse s’assurer du bon déroulement logistique. Une carte d’identité sera demandée à l’entrée de la SGCIB.

Un grand merci à la Société Générale et à Xebia pour nous aider dans l’organisation de ce meeting et nous prêter leur salle.

Posted in meetup | 1 Comment

DataLake, MapReduce & Spark, Véhicules Connectés

Bonjour à tous,

C’est au campus de l’IESEG, au cœur de la Grande Arche de La Défense que nous allons nous retrouver le Jeudi 4 Juin dès 18h00 pour le prochain Hadoop User Group. Au programme, modélisation du Data Lake, étude de cas Mappy sur le traitement de logs avec MapReduce et Spark et présentation du projet  « véhicules connectés » de PSA Peugeot Citroën ! 3 sujets autour d’Hadoop comme on les aime !

Talk 1. Les « Data Warehouse » et « Data Mart », leur modélisation en étoiles ou en flocons sont des concepts maîtrisés depuis longtemps. Ils sont la fondation des systèmes de Business Intelligence d’aujourd’hui. L’apparition d’Hadoop, sa capacité à stocker des données  non structurée sont à l’origine des  « Data Lake », réservoir où l’on stocke toutes les données de l’entreprise … avec la promesse d’en déduire de nouvelles opportunités de business. Peut-on appliquer, ou doit-on appliquer les mêmes concepts de modélisation avec Hadoop ? Ne faut-il pas tout remettre en cause ? Cyrille Coqueret , Directeur Technique Business Intelligence & Big Data de la société EDIS Consulting détaillera les bonnes pratiques à mettre en œuvre pour modéliser un « Data Lake »

Talk 2. Mappy, le service de cartographie et d’informations géolocalisées sur web et mobile qui permet de se déplacer facilement jusque dans nos commerces, tout le monde connait ! La société s’est lancée dans l’aventure Hadoop il y a deux ans pour gérer des centaines de giga de « logs » provenant de centaines de serveurs, contrôler leurs performances, leurs usages mais aussi identifier les nouveaux « points d’intérêt » des utilisateurs web. Florent Voignier, Architecte Big Data chez Databig et Nicolas Korchia, responsable Business Intelligence chez Mappy nous raconteront l’aventure technique par laquelle ils sont passés, de Hadoop 1 à Hadoop 2, Map Reduce vs Spark et les évaluations des différents outils SQL comme HBase/Phoenix, Impala et Tableau.

Talk 3. L’internet des objets est là. L’Airbus A350, équipé de 6.000 capteurs, génère 2,5 TB d’information par vol. Ces données sont ensuite analysées pour, entre autres, optimiser la consommation des moteurs. Plus proche de nous, la voiture de monsieur tout le monde sera bientôt connectée et dialoguera avec son environnement. Chez PSA Peugeot Citroën, autre fleuron industriel, on travaille sur les véhicules connectés dans l’optique d’améliorer sécurité, confort, maintenance préventive, gestion du trafic. On pensait que les Big Data étaient Big, nous n’avons certainement encore rien vu ! Michael Thiriet, Architecte Technique BI et Big Data chez PSA nous fera découvrir ce fabuleux projet.

Remarque: pour des raisons de sécurité, la liste des participants sera communiquée 24h avant l’événement à la Grande Arche. Merci d’indiquer un nom, prénom et une adresse email professionnelle valide lors de votre inscription meetup. Merci à ceux possédant déjà une fiche meetup de vérifier la cohérence des informations saisies. Inscriptions possibles jusqu’au 3 Juin, 17h.

Merci à la société EDIS Consulting, sponsor de l’événement et à l’IESEG School of Management de nous accueillir

Enregistrement à : http://www.meetup.com/Hadoop-User-Group-France/events/222610836/

Posted in meetup | 1 Comment

Hadoop & La sécurité : Meetup chez Zenika le 29 avril

Bonjour à tous,

Nous avons le plaisir de vous inviter au meetup du mercredi 29 Avril 2015  chez Zenika (10 rue de Milan 75009 Paris) à 19h00.

Au programme, des sessions en Français suivies d’un apéro networking.
Accueil des participants à 18h30

Table ronde : La sécurité à l’heure de la big data.

Speakers:

- Nicolas Maillard, ingénieur Solutions – EMEA Hortonworks
- Gérard PELIKS, président de l’atelier sécurité au Forum Atena et expert sécurité
- David WORMS, directeur de « Adaltas »
- Yann SESE, responsable du centre d’Excellence Data Intelligence chez Sogeti – Capgemini Group.

La table ronde sera animée par Aroua Biri, experte en transformation digitale et en cybersécurité.

Abstract:

Les décideurs sont de plus en plus convaincus de l’enjeu stratégique qu’est la sécurité des données des entreprises et de l’état.

D’autant plus que des technologies aussi puissantes que le big data sont en train de maturer.

Parler de sécurité et de big data c’est parler organisation et technique. La composante technique comprend deux axes: la sécurisation des plateformes big data (type hadoop) et l’usage des technologies big data comme outils de sécurité.

Au cours de cette table ronde, nous passerons en revue avec les intervenants dans un premier temps les différents enjeux sécurité des plateformes big data. Dans un second temps, nous décrirons comment les outils big data peuvent renforcer la sécurité des entreprises.

 

Merci de vous enregistrer afin que l’on puisse s’assurer d’avoir assez à manger et à boire et merci à Zenika de nous accueillir.

Posted in meetup | Leave a comment

Devoxx France au Palais des congrès le Jeudi 9 avril 2015 20h30 : BOF Hadoop & Spark

Cher Hadoopiens & Sparkiens,

Nous vous invitons pour un meetup special (BOF -Bird of a Feather) lors de Devoxx France ce jeudi 9 avril au Palais des congrès (Salle Paris 221M-222M Lab).

Vous pouvez également soumettre un mini-talk via le formulaire suivant :  http://goo.gl/forms/3omKPgRGaK

Ce meetup sera une bonne occasion d’échanger autour d’hadoop et de Spark : on espère vous voir nombreux!

Pour pouvoir rentrer à Devoxx (à partir de 19h) et assister à votre meetup, il faut absolument vous inscrire sur https://www.eventbrite.com/e/venez-decouvrir-devoxx-france-le-temps-dune-soiree-tickets-16446026508

A jeudi!

http://cfp.devoxx.fr/2015/talk/WWJ-3073/BOF_Hadoop_User_Group_%2FSpark_Meetup

Posted in meetup | Leave a comment