DATA

Cursus - Actuaires : devenez data scientist

Se former aux langages R & Python

Nouveau !

ACU03

8 jours

56 heures

5 500 €ht

Objectifs de la formation

  • Définir l'environnement de développement en R

  • Coder des opérations sur R

  • Distinguer les méthodes d'apprentissage

  • Appréhender l'environement python

  • Coder sur Pyhton

Programme

Cursus - Actuaires : devenez data scientist

Se former aux langages R & Python

8 jours 56 heures

télécharger le programme

  • MODULE 1 - PROGRAMMER EN PYTHON : NIVEAU 1

  • Appréhender les principes de bases du développement

    • Présentation du langage Python
    • Installer le logiciel Python
    • Savoir utiliser Python : Jupyter Notebook
    • Maîtriser les différentes fonctionnalités : les imports, les variables, les fichiers Script, les boucles, les fonctions
  • Connaître les formats de données et réaliser des opérations basiques

    • Qu’est-ce qu’un Iterables
    • Mener des opérations sur les itérables
    • Comprendre l’utilité des tableaux de données (dataframes) et savoir les créer
    • Apprendre à créer et utiliser des classes
  • Manipulation avancée des données / étude de cas

    • Description du dataset utilisé
    • Lire des fichiers .csv
    • Manipulation des tableaux de données : utiliser le module package Panda
    • Manipuler les graphiques
  • Le module inclut de nombreuses mises en pratique sur le logiciel Python
  • MODULE 2 - ACQUERIR LES BASES DU MACHINE LEARNING AVEC PYTHON : NIVEAU 2

  • Cerner les outils et techniques nécessaires aux méthodes de l'analyse de données et au machine learning

    • Assimiler les techniques de data cleaning
    • Comprendre le fonctionnement du formatage de données
  • Savoir gérer l’acquisition et la préparation des données : open data (INSEE, météo… API, scrapping web…)

  • Maîtriser les algorithmes supervisés

    • Comment les algorithmes s’entraînent-ils ? Illustration d’exemples de régressions et de l’arbre de décision
    • Comment optimiser les paramètres des algorithmes
    • Tester des algorithmes supervisés : méthodologie
    • Comprendre les hyperparamètres et leurs fonctionnements
    • Gérer le surapprentissage
    • Connaître les principaux algorithmes : SVM, bayésien naïf, réseaux baysésiens, réseaux de neurones
  • Savoir utiliser les algorithmes non supervisés

    • Comprendre le clustering
  • Comprendre la datavisualisation : Matplotlib

  • Assimiler les méthodes de text mining

    • Procéder à une extraction de texte dans un document
    • Construction de variables explicatives à partir du texte
    • Application de modèles supervisés sur des données textuelles
  • Le module inclut de nombreuses mises en pratique sur le logiciel Python
  • MODULE 3 - PROGRAMMER EN R : NIVEAU 1

  • Appréhender les principes de bases du développement en R

    • Présentation du langage R
    • Installer le logiciel R
    • Savoir utiliser R : premiers pas avec R
    • Maîtriser les différentes fonctionnalités : les variables, les fichiers Script, les boucles, les fonctions
  • Connaitre les formats de données et réaliser des opérations basiques

    • Maîtriser les structures de données : Vecteurs, Listes, Matrices, Dataframes
    • Exercices pratiques sur les opérations de structures de données *Facteurs
  • Engager des manipulations avancées des données

    • Savoir décrire le dataset utilisé
    • Lire des fichiers .csv
    • Package dplyr, manipulation des tableaux de données
    • Créer des graphiques
    • Étude de cas : entraînement de premiers modèles et interprétations
  • Le module inclut de nombreuses mises en pratique sur le logiciel R
  • Module 4 - Acquérir les bases du Machine Learning avec R : Niveau 2

  • Cerner les outils et techniques nécessaires aux méthodes de l'analyse de données et au machine learning

    • Assimiler les techniques de data cleaning
    • Comprendre le fonctionnement du formatage de données
  • Savoir gérer l’acquisition et la préparation des données : open data (INSEE, météo… API, scrapping web…)

  • Maîtriser les algorithmes supervisés

    • Gérer l’implémentation concrète
    • Comment les algorithmes s’entraînent-ils ? Illustration d’exemples de régressions et de l’arbre de décision
    • Comment optimiser les paramètres des algorithmes
    • Tester des algorithmes supervisés : méthodologie
    • Comprendre les hyperparamètres et leurs fonctionnements
    • Gérer le surapprentissage
    • Connaître les principaux algorithmes : SVM, bayésien naïf, réseaux baysésiens, réseaux de neurones
  • Savoir utiliser les algorithmes non supervisés

    • Comprendre le clustering
  • Comprendre la datavisualisation : Application RShiny

  • Assimiler les méthodes de text mining

    • Procéder à une extraction de texte dans un document
    • Construction de variables explicatives à partir du texte
    • Application de modèles supervisés sur des données textuelles
  • Le module inclut de nombreuses mises en pratique sur le logiciel R

Animée par

  • Alberto GUGGIOLA

    Alberto GUGGIOLA Quantmetry

  • Alberto GUGGIOLA

    Quantmetry

    Data Scientist

  • Alberto Guggiola est docteur en physique de l'ENS Paris, et a travaillé pendant sa thèse sur la compréhension des événements rares qui peuvent se produire sur les graphes. Au cours de sa thèse, il a eu l’occasion de présenter son travail à des publics hétérogènes. En 2015, il rejoint Quantmetry en tant que Data Scientist, convaincu de la contribution que son expertise dans la modélisation de différents systèmes aurait pu apporter dans la recherche de solutions data-driven aux problèmes de leurs clients. Il a travaillé dans des contextes business variés comme la santé (étude de l’impact d’une protéine sur le pronostic des cancers du sein), l’assurance (détermination de l’appétence à un ensemble de produits, anti-churn) et les transports (amélioration d’une application mobile grâce à l’exploitation des données de géolocalisation). Il a ainsi participé à plusieurs activités pédagogiques : organisation et animation de formations en Machine Learning, accompagnement des équipes au cours d’Hackathon. Il est récemment devenu responsable éditorial du blog Quantmetry.
  • SES ANIMATIONS :

    Programmer en R - Niveau 1, Les fondamentaux techniques pour devenir data scientist

Publics concernés

  • Toute personne ayant une première expérience confirmée dans le milieu de l’actuariat et souhaitant avoir des missions de data scientist

Critères d'admission

  • Pour participer à chacun des modules, les stagiaires doivent être munis d’un ordinateur portable et avoir téléchargé les packages R et Pyhton (logiciels Open Source et gratuits)

Prérequis de la formation

  • Aucun prérequis n'est nécessaire

Certifications et Agréments

PPC

Cette formation est homologuée "PPC" par l'Institut des Actuaires. Elle donne accès à des "points PPC" aux actuaires qui y assistent.

ISQ-OPQF

Qualification professionnelle délivrée aux organismes de formations en reconnaissance de leur professionnalisme. Il est fondé sur les critères suivants de respect de la règlementation, l'adéquation des compétences et des moyens techniques et humains aux actions de formation, la satisfaction des clients, la pérennité financière, le respect du code de déontologie, du code de conduite professionnelle et du règlement intérieur.

Prise en charge OPCA

Notre organisme est référencé par les OPCA et nos formations peuvent être prise en charge

Prochaine(s) session(s)

  • Paris

    12/09-18/10/2019

    Modules Dates
    Module 1 12-13/09/19
    Module 2 26-27/09/19
    Module 3 08-09/10/19
    Module 4 17-18/10/19

Tarif(s) d'inscription

Le tarif comprend : l'accès à l’événement et/ou formation, les pauses, la restauration (selon le format et les horaires de l’événement), les supports papier ou électronique pour les événements de format conférence et les formations
Tarif général 5 500,00 €HT / 6 600,00 € TTC

Programme disponible en intra

contactez-nous

Modalités pédagogiques

  • Un questionnaire préalable sera envoyé aux participants pour recueillir leurs besoins et attentes spécifiques, et sera transmis au(x) formateur(s) avant la formation
  • Les Cursus sont déroulés en présentiel étayés, chaque fois que cela est pertinent, d’études de cas et de mise en pratique ou en situation
  • Les cursus comportent un système de validation des compétences par un dispositif de certification professionnelle, entérinés par un examen final devant un jury pédagogique
  • Un formulaire d’évaluation des formateurs et du déroulé du programme suivi sera proposé aux participants à la fin du stage
S’inscrire Ajouter à ma sélection