Techniques de clustering en analyse actuarielle (en Python)

D. Hainaut, PhD

Description

Les algorithmes de clustering (ou de regroupement) ont pour objectif la découverte de structures non directement observable au sein d’une base de données.  Ces méthodes font partie de la famille des algorithmes non-supervisés qui regroupent les données en maximisant un critère d’hétérogénéité entre ces classes.

La formation présente les principaux algorithmes de clustering utilisés tant pour la visualisation d’un portefeuille d’assurance, que pour l’identification des profils types d’assurés ainsi que leur sinistralité. Notre approche repose sur une nouvelle distance entre les contrats qui nous permet de gérer les variables explicatives catégorielles à l’aide des algorithmes de clustering.

Le cours est illustré avec des exemples en Python, fournis aux participants.

Programme

  1. Retour sur l’analyse en composantes principales

  2. Traitement des variables catégorielles avec une distance khi-carré

  3. Analyse en composantes factorielles pour les données catégorielles

  4. Algorithme de clustering sur variables catégorielles

  5. Regroupement flou (fuzzy K-means)

  6. Représentation graphique des données et analyse spectrale (Spectral K-means)

Orateur

Donatien Hainaut

Donatien Hainaut

Conseiller Scientifique, Detralytics
Professeur, UCLouvain

Date : À la demande

Durée : 3h

Accréditation : 3CPD | 18PPC

Niveau : Tout

Compétences acquises

À l’issue de cette formation, les participants seront capables de :

  • Visualiser les objets et les caractéristiques d’un jeu de données catégorielles;
  • Identifier les clusters de risques assurés et leurs caractéristiques dominantes;
  • Maîtriseront les techniques de conversion d’un jeu de données en un graphe et d’identifier les clusters de formes non-convexes à l’aide de la décomposition spectrale d’un graphe.

À propos de notre orateur

Donatien Hainaut

Dernière chance

Ne manquez pas notre prochain Lunch & Learn