Internacionalización: ¿cómo escalar su modelo de datos?

Internacionalización: ¿cómo escalar su modelo de datos?

Imagínese una empresa que concede préstamos en Francia, pero que ahora quiere desarrollarse en otros países, especialmente en Europa. Observación inmediata: ¡no es tan fácil! Incluso en la Unión Europea, los contextos varían mucho. Datos no homogéneos, sistemas de crédito que funcionan de manera diferente... La empresa puede llevarse una sorpresa muy desagradable y verse obligada a reconstruir su modelo de puntuación desde cero.

Lejos de ser hipotética, esta situación era común hasta hace poco. Diseñar un modelo de datos que se aplique a todos los países es complicado, pero no imposible. Especialmente desde la provisión de un recurso poderoso: los datos de banca abierta.

En Algoan, nos hemos esforzado por crear un modelo de puntuación crediticia API desde el primer día, escalable internacionalmente, según estos datos de Open Banking. ¿Cómo lo hicimos? Camille Charreaux, nuestra directora de ciencia de datos, abre el telón de nuestras opciones en términos de datos para crear un producto que se adapte a todas las geografías, sin que se trate de una fábrica de gas.

Datos accesibles pero dispares

¿Recuerdas tu última experiencia con una solicitud de crédito? Si tiene más de 5 años, es probable que tenga este aspecto:

«Tradicionalmente, en Francia, las entidades de crédito piden a los consumidores que solicitan un préstamo que rellenen un formulario en línea. De 10 a 20 preguntas que deben responderse declarando su situación familiar, ingresos, gastos, otros préstamos actuales, etc.»

Y si se ha puesto en contacto con varios bancos u organizaciones de crédito, lo sabe: los cuestionarios varían de unos a otros... al igual que las decisiones de conceder préstamos. (¡Imagínese entonces entre diferentes países!)

Un enfoque que no está exento de problemas:

  • Los datos son declarativos. Esto significa que puede haber errores, descuidos y omisiones. A menudo hay una brecha entre los ingresos, que se sobreestiman, y los gastos, que se subestiman. Con una tendencia a no declarar otros préstamos en curso para optimizar sus posibilidades.
  • Los datos no son financieros. No solo en cualquier caso: una gran parte de ellos son datos demográficos y socioprofesionales (edad, situación familiar, categoría laboral, etc.). Sin embargo, para saber si una persona podrá devolver su crédito, los datos financieros son los más fiables.

Ya sea por la recopilación de datos o por su naturaleza, este modelo de calificación crediticia no es óptimo. Además, hay una capa adicional de complejidad: diferentes operaciones en diferentes países, con la presencia de Agencias de crédito.

«Este es un enfoque con el que no estamos familiarizados en Francia, pero es común en muchos países. Las agencias de crédito son agencias que recopilan información sobre el crédito en poder de los consumidores. En particular, los proporcionan a las instituciones de crédito, que obtienen una visión global de la situación de un ciudadano».

Los datos ya no son solo declarativos, lo que resuelve parte del problema. Sin embargo, están surgiendo otros:

  • Los datos recopilados varían de un país a otro, incluso con oficinas de crédito presentes en varios países.
  • Según el país, no todos los créditos se graban en Oficinas de crédito, lo que crea disparidades.
  • Los datos recopilados no son tan granulares como los datos bancarios.
  • Solo los ciudadanos que ya han solicitado un préstamo están presentes en las bases de datos. Puede resultar difícil obtener una calificación crediticia (y, por lo tanto, tener acceso al crédito) con una primera solicitud. En los Estados Unidos, por ejemplo, sin una calificación FICO, es difícil obtener un préstamo.

Incluso cuando las entidades de crédito pasen Oficinas de crédito, deben adaptar sus modelos de puntuación de acuerdo con los datos recopilados por cada uno.

Buenas noticias: esta forma de trabajar ha cambiado en los últimos años.

  • En primer lugar, con la aparición en la década de 2010 de los agregadores que recopilaban datos bancarios de consumo. Este método consiste en recopilar datos financieros a fin de evaluar las posibilidades de una persona de reembolsar su crédito, mediante el uso de la web scraping.
  • Un enfoque que carecía de seguridad hasta la entrada en vigor de la PSD2, la segunda directiva europea sobre pagos, en 2019. Garantiza el acceso a los datos bancarios, al exigir a los bancos que configuren API seguras, con mecanismos de autenticación estrictos. Es el famoso «Open Banking». Esto permitió a los agregadores desarrollar conexiones seguras y confiables, proporcionando datos bancarios, universales y granulares.

Estos datos de Open Banking crean una base sólida para construir modelos. escalable internacionalmente.

La banca abierta: una oportunidad innegable para el procesamiento de datos

¿Por qué estos datos de Open Banking están cambiando radicalmente las reglas del procesamiento de datos?

«Los datos de Open Banking vienen en formatos que son bien conocidos en el mundo de la ciencia de datos. Son numéricos (importes de las transacciones) y textuales. Tenemos una perspectiva sobre los tipos de modelos y arquitecturas que funcionan en estas categorías de datos».

Su propia naturaleza resuelve muchos problemas encontrados en la calificación crediticia tradicional:

  • Siempre son los mismos datos, en un formato similar.
  • La fuente de datos es única e infalsificable. Ya no es declarativo: los datos se obtienen directamente a través de las cuentas bancarias de los usuarios.

En resumen, estos datos son representativos de la situación financiera de las personas que solicitan un préstamo. Son una base perfecta para construir un modelo de datos que pueda reproducirse internacionalmente.

«La banca abierta, lejos de ser un nicho, está cambiando profundamente la forma en que se otorgan los créditos. En Algoan, hemos optado por trabajar con varios agregadores, que se conectan directamente a las API bancarias para recopilar datos. De esta forma, evitamos desarrollar nuestros propios conectores. Estamos enfocados en desarrollar nuestra API de calificación crediticia».

La banca abierta es un cambio de paradigma para las vías crediticias y abre oportunidades para el desarrollo de productos. escalable internacionalmente.

cómo Escalador ¿un producto basado en datos?

Los datos de la banca abierta son un recurso poderoso. Entonces, aún es necesario crear modelos de datos que puedan Escalador confiando en ello.

«Sabíamos desde el primer día que queríamos ofrecer un producto global. Esto es importante porque se ha integrado de forma nativa en la construcción de nuestros modelos de datos: la forma en que los recopilamos, cómo los procesamos, etc.»

Este es el método que adoptamos en Algoan:

Hora 0 diseñar las funcionalidades:

El propósito de esta primera fase es inventariar las funcionalidades que se requieren, para saber qué datos recopilar. En nuestro caso, conocíamos los diferentes pasos que conducen a la concesión del crédito. Por lo tanto, revisamos cada etapa de la decisión de adjudicación para decidir qué variables eran las más relevantes para seleccionar. Son aquellas que permiten establecer el perfil bancario preciso de los consumidores (ingresos, volatilidad de los gastos, uso del sobregiro bancario, incidencias, etc.).

Hora 1 construya el esqueleto del algoritmo genérico:

El objetivo es construir un esqueleto adaptado a todos los contextos. Esto es manejable con datos bancarios. Una vez definida esta arquitectura, se trabaja mucho en los datos y en su estrategia de recopilación y etiquetado. Con los datos de la banca abierta, el preprocesamiento es similar en todos los países (se limpian y simplifican los datos que se van a inyectar en los algoritmos).

Luego es necesario entrenar a los algoritmos, que aprenden gracias a las etiquetas que se les dan. Su objetivo es adivinar estas etiquetas por sí solas a partir de datos futuros.

Hora 2 personalice el producto con datos específicos:

Una vez que se haya creado la capa base universal, podemos centrarnos en los datos más específicos del contexto de cada país (costumbres, hábitos sociales, estilo de vida, etc.) y establecer una estrategia de etiquetado complementaria.

«Para escalar un producto basándose en datos, tener una visión internacional desde el principio es casi esencial. Esto ahorra un tiempo valioso en el futuro, ya que los algoritmos se diseñaron para ello. Por lo tanto, es necesario pensar primero en lo universal, que será una base duplicable para todos los países, y luego añadir un nivel de especialización para responder con precisión al contexto local».

La buena noticia es que, en lo que respecta a los datos, la mejora es continua. Los algoritmos se mejoran constantemente. Cuantos más datos tengamos, mejor será nuestro desempeño. Cuanto mejor lo haga, más datos tendrá. Este círculo virtuoso solo es posible si se utilizan las estrategias adecuadas para la recopilación, entonces Escalado, se han establecido los datos.

En el crédito, esto se hace más fácil gracias a Open Banking. Es una base sólida para toda la propuesta de valor desarrollada por Algoan: mejorar el acceso al crédito. Con los datos de Open Banking, podemos ofrecer un producto que funciona mejor y que funciona en todas partes.

Un projet ? Une question ?

Vous souhaitez changer votre manière de prendre vos décisions de crédit ? Discutons-en !