DATA

Cursus - Actuaires : devenez data scientist

Se former aux langages R & Python

ACU03

8 jours

56 heures

Objectifs de la formation

  • Définir l'environnement de développement en R

  • Coder des opérations sur R

  • Distinguer les méthodes d'apprentissage

  • Appréhender l'environement python

  • Coder sur Pyhton

Programme

Cursus - Actuaires : devenez data scientist

Se former aux langages R & Python

8 jours 56 heures

télécharger le programme

  • MODULE 1 - PROGRAMMER EN PYTHON : NIVEAU 1

  • Appréhender les principes de bases du développement

    • Présentation du langage Python
    • Installer le logiciel Python
    • Savoir utiliser Python : Jupyter Notebook
    • Maîtriser les différentes fonctionnalités : les imports, les variables, les fichiers Script, les boucles, les fonctions
  • Connaître les formats de données et réaliser des opérations basiques

    • Qu’est-ce qu’un Iterables
    • Mener des opérations sur les itérables
    • Comprendre l’utilité des tableaux de données (dataframes) et savoir les créer
    • Apprendre à créer et utiliser des classes
  • Manipulation avancée des données / étude de cas

    • Description du dataset utilisé
    • Lire des fichiers .csv
    • Manipulation des tableaux de données : utiliser le module package Panda
    • Manipuler les graphiques
  • Le module inclut de nombreuses mises en pratique sur le logiciel Python
  • MODULE 2 - ACQUERIR LES BASES DU MACHINE LEARNING AVEC PYTHON : NIVEAU 2

  • Cerner les outils et techniques nécessaires aux méthodes de l'analyse de données et au machine learning

    • Assimiler les techniques de data cleaning
    • Comprendre le fonctionnement du formatage de données
  • Savoir gérer l’acquisition et la préparation des données : open data (INSEE, météo… API, scrapping web…)

  • Maîtriser les algorithmes supervisés

    • Comment les algorithmes s’entraînent-ils ? Illustration d’exemples de régressions et de l’arbre de décision
    • Comment optimiser les paramètres des algorithmes
    • Tester des algorithmes supervisés : méthodologie
    • Comprendre les hyperparamètres et leurs fonctionnements
    • Gérer le surapprentissage
    • Connaître les principaux algorithmes : SVM, bayésien naïf, réseaux baysésiens, réseaux de neurones
  • Savoir utiliser les algorithmes non supervisés

    • Comprendre le clustering
  • Comprendre la datavisualisation : Matplotlib

  • Assimiler les méthodes de text mining

    • Procéder à une extraction de texte dans un document
    • Construction de variables explicatives à partir du texte
    • Application de modèles supervisés sur des données textuelles
  • Le module inclut de nombreuses mises en pratique sur le logiciel Python
  • MODULE 3 - PROGRAMMER EN R : NIVEAU 1

  • Appréhender les principes de bases du développement en R

    • Présentation du langage R
    • Installer le logiciel R
    • Savoir utiliser R : premiers pas avec R
    • Maîtriser les différentes fonctionnalités : les variables, les fichiers Script, les boucles, les fonctions
  • Connaitre les formats de données et réaliser des opérations basiques

    • Maîtriser les structures de données : Vecteurs, Listes, Matrices, Dataframes
    • Exercices pratiques sur les opérations de structures de données *Facteurs
  • Engager des manipulations avancées des données

    • Savoir décrire le dataset utilisé
    • Lire des fichiers .csv
    • Package dplyr, manipulation des tableaux de données
    • Créer des graphiques
    • Étude de cas : entraînement de premiers modèles et interprétations
  • Le module inclut de nombreuses mises en pratique sur le logiciel R
  • Module 4 - Acquérir les bases du Machine Learning avec R : Niveau 2

  • Cerner les outils et techniques nécessaires aux méthodes de l'analyse de données et au machine learning

    • Assimiler les techniques de data cleaning
    • Comprendre le fonctionnement du formatage de données
  • Savoir gérer l’acquisition et la préparation des données : open data (INSEE, météo… API, scrapping web…)

  • Maîtriser les algorithmes supervisés

    • Gérer l’implémentation concrète
    • Comment les algorithmes s’entraînent-ils ? Illustration d’exemples de régressions et de l’arbre de décision
    • Comment optimiser les paramètres des algorithmes
    • Tester des algorithmes supervisés : méthodologie
    • Comprendre les hyperparamètres et leurs fonctionnements
    • Gérer le surapprentissage
    • Connaître les principaux algorithmes : SVM, bayésien naïf, réseaux baysésiens, réseaux de neurones
  • Savoir utiliser les algorithmes non supervisés

    • Comprendre le clustering
  • Comprendre la datavisualisation : Application RShiny

  • Assimiler les méthodes de text mining

    • Procéder à une extraction de texte dans un document
    • Construction de variables explicatives à partir du texte
    • Application de modèles supervisés sur des données textuelles
  • Le module inclut de nombreuses mises en pratique sur le logiciel R

Animée par

  • Alberto GUGGIOLA

    Alberto GUGGIOLA Quantmetry

Publics concernés

  • Toute personne ayant une première expérience confirmée dans le milieu de l’actuariat et souhaitant avoir des missions de data scientist

Critères d'admission

  • Pour participer à chacun des modules, les stagiaires doivent être munis d’un ordinateur portable et avoir téléchargé les packages R et Pyhton (logiciels Open Source et gratuits)

Prérequis de la formation

  • Aucun prérequis n'est nécessaire

Certifications et Agréments

PPC

Cette formation est homologuée "PPC" par l'Institut des Actuaires. Elle donne accès à des "points PPC" aux actuaires qui y assistent.

ISQ-OPQF

Qualification professionnelle délivrée aux organismes de formations en reconnaissance de leur professionnalisme. Il est fondé sur les critères suivants de respect de la règlementation, l'adéquation des compétences et des moyens techniques et humains aux actions de formation, la satisfaction des clients, la pérennité financière, le respect du code de déontologie, du code de conduite professionnelle et du règlement intérieur.

Prise en charge OPCA

Notre organisme est référencé par les OPCA et nos formations peuvent être prise en charge

Prochaines sessions et tarifs

Pour plus d'information sur les dates de sessions et les tarifs, contactez-nous

Modalités pédagogiques et d’évaluation

  • Tous nos stages de formations sont limités, dans la mesure du possible, à une douzaine de participants.
  • Les modules des cursus se déroulent en présentiel ou en classe virtuelle avec un équilibre théorie / pratique. Chaque fois que cela est pertinent des études de cas et des mises en pratique ou en situation sont proposées aux stagiaires.
  • Un questionnaire préalable dit ‘questionnaire pédagogique’ est envoyé aux participants pour recueillir leurs besoins et attentes spécifiques. Il est transmis aux intervenant(e)s avant la formation, leur permettant de s’adapter aux publics.
  • Chaque module se clôture par une évaluation à chaud de la satisfaction du stagiaire sur le déroulement, l’organisation et les activités pédagogiques de la formation. Les intervenant(e)s évaluent également la session.
  • Une auto-évaluation des acquis pré et post formation, sur chaque module, est effectuée en ligne afin de permettre au stagiaire de mesurer sa progression individuelle tout au long du cursus.
  • Le cursus est sanctionné par un certificat remis sous réserve de l’obtention du score minimal cumulé de l’épreuve écrite et de l’épreuve orale.
  • Une évaluation à froid du cursus sera effectuée de façon systématique à 6 mois et 12 mois pour s’assurer de l’ancrage des acquis et du transfert de compétences en situation professionnelle, soit par téléphone soit par questionnaire en ligne.
Nous contacter