Pourquoi la donnée Open Banking doit être enrichie par le Machine Learning ?
Partie 1 : L’activité du compte bancaire
Dans le cadre de la décision de crédit, la donnée Open Banking est considérée comme la plus fiable.
Difficilement falsifiable puisque directement sourcée auprès de la Banque, l’accès à la donnée Open Banking est encadré par un processus d’authentification bancaire, nécessaire à son agrégation.
Pour résumer : la donnée Open Banking est une donnée protégée tant par la réglementation (DSP2) que par la technologie qui y donne accès.
Pourtant, un accès direct à la donnée bancaire n’est pas une garantie de sa qualité.
En effet, les usages des consommateurs ont évolué et les données bancaires des individus sont aujourd’hui réparties entre plusieurs établissements financiers.
On ne parle désormais plus de banque principale : chaque consommateur, pour la grande majorité, est multi-bancarisé. La réception d’un salaire peut avoir lieu sur un compte, et le paiement des factures peut être effectué depuis un autre.
Il devient alors plus facile pour les consommateurs de cacher les informations financières qui les “embarrassent” en partageant un compte bancaire “neutre” plutôt que l’ensemble de leurs comptes, dans le cadre de leur demande de crédit.
En tant que prêteur, il est donc important de s’adapter et d’identifier ces différents profils afin que cela soit correctement pris en compte dans l’analyse de risque.
Chez Algoan, l’équipe Data Science a développé un score d’activité qui vient enrichir nos outils d’aide à la décision de crédit reposant sur la donnée Open Banking.
Celui-ci permet aux prêteurs d’identifier les comptes dont l’activité semble anormale ou insuffisante pour prendre une décision de crédit. Et ce, sans devoir mettre en place par eux même des règles métier complexes qui valideraient la pertinence des comptes synchronisés.
Par exemple, un compte présentant uniquement des virements internes pourra être considéré comme sain par un score comportemental, de par la stabilité de la trésorerie et l’équilibre budgétaire du compte.
Pour autant, son activité ne sera pas suffisante pour prendre une décision de crédit fiable. L’agrégation d’un autre compte devrait alors être demandée.
Cet Activity Score, comment fonctionne-t-il ?
Ce score d’activité repose sur la combinaison de règles strictes d’exclusion et d’indicateurs d’évaluation de l’activité du compte bancaire.
Les règles strictes permettent de mettre directement de côté les profils dont l’inactivité est la plus évidente. Si l’une de ces règles est déclenchée, (par exemple : aucune transaction sortante identifiée sur les comptes), le score d’activité suggère un “No Go” immédiat.
En revanche, si les règles strictes ne sont pas déclenchées, un second niveau d’évaluation prend automatiquement le relais. Les algorithmes de détection du type de paiement (paiement par carte, prélèvement, etc), de catégorisation (salaire, remboursement de prêt, shopping, etc.) et de régularité sont mis à profit pour calculer un ensemble d’indicateurs qui s’articulent autour des trois piliers suivants :
- Activité du compte : nombre de transactions, profondeur de l’historique, etc ;
- Revenus : salaire, aides sociales ou autres revenus réguliers ;
- Dépenses : paiements par carte, loyer, prélèvements pour l’électricité, les télécom, etc.
Ces indicateurs sont pondérés par nos algorithmes pour obtenir un score entre 0 et 100 pouvant être interprété de la façon suivante :
- Moins de 20 : activité insuffisante ;
- Entre 20 et 50 : activité limitée ;
- A partir de 50 : activité normale et caractéristique de comptes actifs.
Aujourd’hui, nous observons entre 5 et 10% d’utilisateurs avec un score d’activité inférieur à 20 (activité insuffisante).
Cette interprétation fine a été rendue possible grâce à l’analyse de millions de données bancaires, effectuées depuis 2018 par nos algorithmes d’analyse et d’enrichissement de la donnée Open Banking. Grâce à l’identification précise des différents profils Open Banking, nous sommes capables de fournir une analyse fiable de l’activité bancaire du candidat à l’emprunt. Cette analyse vient en complément d’un score comportemental, qui lui évalue la probabilité de défaut du candidat à l’emprunt en se basant sur son comportement financier. Cette combinaison permet de détecter les individus les plus à risque pour le prêteur.
Avec l’arrivée de l’Open Finance, l’accès supplémentaire à des comptes d’épargne et aux données d’investissement des individus permettront sans aucun doute d’améliorer encore une fois la performance et la fiabilité des décisions de crédit. Dans ce contexte où plusieurs sources de données financières pourront être croisées, la fraude – déjà compromise par l’Open Banking – sera encore plus complexe à mettre en place, et ça nous arrange !
Ça peut aussi vous intéresser
Un projet ? Une question ?
Vous souhaitez changer votre manière de prendre vos décisions de crédit ? Discutons-en !