Les algorithmes de clustering (ou de regroupement) ont pour objectif la découverte de structures non directement observable au sein d’une base de données. Ces méthodes font partie de la famille des algorithmes non-supervisés qui regroupent les données en maximisant un critère d’hétérogénéité entre ces classes.
La formation présente les principaux algorithmes de clustering utilisés tant pour la visualisation d’un portefeuille d’assurance, que pour l’identification des profils types d’assurés ainsi que leur sinistralité. Notre approche repose sur une nouvelle distance entre les contrats qui nous permet de gérer les variables explicatives catégorielles à l’aide des algorithmes de clustering.
Le cours est illustré avec des exemples en Python, fournis aux participants.
Retour sur l’analyse en composantes principales
Traitement des variables catégorielles avec une distance khi-carré
Analyse en composantes factorielles pour les données catégorielles
Algorithme de clustering sur variables catégorielles
Regroupement flou (fuzzy K-means)
Représentation graphique des données et analyse spectrale (Spectral K-means)
Conseiller Scientifique, Detralytics
Professeur, UCLouvain
Date : À la demande
Durée : 3h
Accréditation : 3CPD | 18PPC
Niveau : Tout
À l’issue de cette formation, les participants seront capables de :
Donatien Hainaut est Conseiller Scientifique chez Detralytics et Professeur à l’UCLouvain (Belgique), où il dirige le Master en Data Science à orientation statistique. Auparavant, il a occupé plusieurs postes académiques, notamment en tant que Professeur Associé à la Rennes School of Business et à l’ENSAE à Paris. Il possède également une solide expérience en entreprise, ayant travaillé comme Risk Officer, Quantitative Analyst et ALM Officer.
Actuaire qualifié et titulaire d’un doctorat en Asset and Liability Management, ses recherches actuelles portent sur les mécanismes de contagion dans les processus stochastiques ainsi que sur les applications des réseaux de neurones en assurance.