Sciences des données et modelling assurantiel | Module 1 : Introduction

M. Denuit, PhD

Description

Vous sentez-vous perdu dans les forêts aléatoires ? Vous souhaitez démystifier les concepts de validation croisée, bagging, shrinkage… ou découvrir ce qui se cache derrière les acronymes GAM, LASSO, GBM. Vous vous demandez si les GLM sont toujours d’actualité ou devraient être présentés au musée de l’Histoire de l’actuariat ? Si oui, nous vous invitons à participer à ce cours intensif sur les techniques d’apprentissage statistique appliquées à l’assurance !

Cette formation a été conçue par et pour des actuaires afin de prendre en compte toutes les spécificités des données assurantielles. Les sessions de formation se déroulent étape par étape. Rappelant tout d’abord les concepts statistiques fondamentaux sur lesquels reposent les techniques modernes d’apprentissage et les approches standards GLM. Puis présentant les méthodes GAM et GBM. Les mérites respectifs des méthodes sont illustrés au travers de cas pratiques basés sur des données assurantielles.

La formation a pour but d’être interactive : alternant les parties théoriques et pratiques, elle favorise les échanges avec les participants. La documentation, incluant les bases de données et le code R est mise en ligne et partagée avec les participants. L’installation de packages R en amont de la formation est requise.

Programme

Partie 1 : Introduction à l’analyse de l’assurance et des modèles de base

  • Principes statistiques fondamentaux sur lesquels reposent les approches modernes d’apprentissage (base d’apprentissage vs. base de validation, erreur de prédiction, validation croisée, bootstrap, etc.)
  • Spécificité des données assurantielles (nombre de sinistres avec un excès de zéros, sévérité mixant les sinistres attritionnels et graves, données d’observation, biais de sélection, corrélation vs causalité, censure)
  • Tarifs techniques vs. commerciaux
  • Rappel de l’utilisation actuelle du GLM, avec application au provisionnement des sinistres, à la graduation des taux, à la classification des risques
  •  

Partie 2 : Modèles de régression linéaires et non linéaires généralisés

  • Limites des outils GLM et nécessité d’utiliser d’autres techniques
  • Régularisation/shrinkage pour GLM : Lasso, Ridge et pénalités connexes
  • Première extension :
    • GAM, vraisemblance pénalisée et locale
    • GLM doubles, dispersion autour des primes pures
    • GAMLSS, au-delà de la dispersion avec applications au provisionnement des sinistres, à la graduation des taux, à la classification des risques
  • Seconde extension : GAMboost et GBM
    • Régression par étapes en avant
    • Fonctions de perte de la famille exponentielle
    • Gradients comme réponses
  •  

Orateur

Michel Denuit

Michel Denuit

Conseiller Scientifique, Detralytics
Professeur, UCLouvain

Date : À la demande

Durée : 6h

Accréditation : 6CPD | 36PPC

Niveau : Tout

Compétences acquises

À la suite de cette formation, les participants auront acquis une connaissance opérationnelle de l’analyse des données d’assurance. Ils seront capables d’utiliser les différentes méthodes d’apprentissage par arbres de décision et de choisir, selon leurs données et l’objectif de leur analyse, la plus adaptée.

Un mois après la fin de la formation, une discussion de suivi est organisée afin de partager les expériences liées à la mise en œuvre de l’approche qui a été présentée.

À propos de notre orateur

Michel Denuit

Michel est Conseiller Scientifique Honoraire chez Detralytics, ainsi que professeur en sciences actuarielles à l’Université Catholique de Louvain. Il dispose d’une expérience internationale en tant que professeur invité et a initié de nombreux projets en collaboration avec l’industrie. Au sein de Detralytics, Michel accompagne les jeunes talents, dispense des formations de pointe, stimule l’innovation et supervise des projets de R&D.

Dernière chance

Ne manquez pas notre prochain Lunch & Learn