Détection de factures en double - approche data science
Détection et correction des doublons de factures : une mission d'investigation data combinant automatisation et validation humaine
Contexte
Suite à la mise en place d’un nouvel outil de gestion des factures, notre client a constaté des cas de doubles-comptabilisations et de doubles-paiements. Bien que des règles automatiques existent pour éviter ces doublons, certaines anomalies ont été identifiées, nécessitant une analyse approfondie des écritures comptables.
Objectifs
Pour ce groupe détenu par un fonds de Private Equity, l'enjeu était de :
Détecter et quantifier les factures en doublon
Prioriser les cas à investiguer selon leur impact financier
Approche et solution
Notre approche à la fois data-driven et manuelle reposant sur la connaissance métier des équipes s’est déroulée de la manière suivante:
1. Extraction, préparation des données et data assessment
Collecte et structuration des écritures comptables
Nettoyage et normalisation des données pour assurer une analyse fiable
Identification des premiers signaux d’anomalies
2. Définition de critères permettant d’identifier les doublons potentiels
Utilisation de l’expertise métier pour détecter des patterns
Itérations successives pour affiner et enrichir les critères d’identification
3. Extraction automatiséedes doublons potentiels en utilisant des algorithmes de data science et vérification manuelle
Extraction de la liste exhaustive des doublons soupçonnés pour ces critères sur une périodde donnée via l’utilisation d’algorithmes de data science
Pour chaque critère, vérifications manuelles pour éliminer les faux positifs et affiner les critères
4. Liste définitive des doublons
Sélection des lignes avec une forte probabilité d’être des doublons
Sizing de l’impact financier des anomalies détectées
Partage des résultats avec les équipes comptables pour validation
Résultats
Identification de factures en double représentant plusieurs centaines de milliers d’euros en 5 jours de travail.
Témoignage du client
“Sans l’expertise de REKOLT en analyse de données, nous n’aurions pas pu détecter tous ces doublons!”