Cette présentation considère des modèles d’apprentissage linéaire (comme les modèles linéaires généralisés). Pour tenir compte des non-linéarités potentielles des variables continues, il est possible de discrétiser ces variables et de les transformer en variables ordinales. Trois problèmes apparaissent :
i) la matrice des variables explicatives n’est plus de plein rang,
ii) le choix du nombre de modalités est difficile et peut conduire à de l’overfitting,
iii) certaines modalités deviennent non-informatives et peuvent conduire à rendre le modèle « sparse ».
L’exposé présentera une nouvelle pénalisation concurrente de la pénalisation L1 habituellement utilisée. Des expériences numériques illustreront les très bonnes performances de cette nouvelle approche sur plusieurs jeux de données.

Organisateur

  • Chaire DAMI – Data Analytics and Models for Insurance

Lieu

Auditorium Gilles Glicenstein – BNP Paribas Cardif – SITE BERGERE 14 rue Bergère, PARIS, 75009 France