Objectifs du Projet

Chaque année, notre partenaire et client EDE (Économie d’Énergie) traite des centaines de milliers de dossiers dans le cadre du Certificat d’Économie d’Énergie. Face à la recrudescence de fraudes aux CEE qui représentent aujourd’hui plusieurs dizaines de millions d’Euros, un projet de loi énergie prévoit de durcir les contrôles sur les travaux réalisés.

Cette tâche est extrêmement chronophage sans l’aide d’un système automatisé pour repérer rapidement les dossiers suspects.

Le département IA d’OpenStudio s’est donc penché sur une manière efficiente de détecter ces fraudes.

Solutions

Notre équipe a travaillé sur la conception d’un outil permettant le contrôle des dossiers sans surcroît de travail pour le personnel. Grâce à la base de données du client comportant plusieurs centaines de milliers de dossiers associés à diverses données extérieures (gps, suffixe e-mail), nous avons pu mettre en place un mode de prédiction en machine learning (apprentissage supervisé) et implémenter une base de données comportant environ 70 critères par dossier.

Après entraînement sur les données disponibles, l’algorithme de Gradient Boosting reposant sur les technologies XGBoost, LightGBM et CatBoost, va déterminer si un nouveau dossier est suspect et mérite qu’un opérateur humain contacte l’entreprise en charge des travaux. Des tests utilisant la technique des validations croisées sont ensuite appliqués pour révéler l’efficacité de la prédiction.

Notre client étant en mesure de superviser l’apprentissage du réseau de neurones, il peut maintenant effectuer un seuillage pertinent des dossiers, pour obtenir un taux de risque par dossier. Il est désormais envisageable de diviser par 10 voire par 20 le nombre d’interventions humaines dans la recherche de ce type de fraudes.