Dinero, irregularidades… y machine learning

Dinero, irregularidades… y machine learning

0

By Enrique Dans

Un interesante artículo en MIT Tech Review, «The pandemic has changed how criminals hide their cash—and AI tools are trying to sniff it out«, describe cómo la pandemia de coronavirus, con sus confinamientos, la interrupción de los viajes y de muchísimas actividades con trascendencia económica o con manejo de dinero en metálico, ha provocado serios problemas a los delincuentes que intentan regularizar dinero procedente de fuentes irregulares.

Cada año, según cálculos de Naciones Unidas, entre 800,000 millones y dos billones de dólares procedentes de actividades delictivas son lavados y reintroducidos de nuevo en la economía utilizando generalmente pequeños negocios que manejan principalmente dinero en metálico, y desplazándolos irregularmente a través de fronteras entre países. Durante la pandemia, la reducción en la actividad del pequeño comercio y la disminución de los viajes han llevado a que los delincuentes se viesen obligados a buscar nuevas estrategias para blanquear su dinero, que seguí generándose a través de actividades que no se han detenido como el fraude o el comercio de drogas, y eso ha llevado a la aparición de nuevos patrones que no resultan fáciles de detectar mediante los mecanismos utilizados habitualmente.

La solución podría estar en uno de los patrones de uso más conocidos en el ámbito del machine learning: la detección de anomalías. Aplicada a un conjunto de datos, la detección de anomalías permite identificar valores atípicos o outliers que pueden señalar fraude o problemas de calidad de datos, sin necesidad de haber etiquetado los datos previamente. Las técnicas de aprendizaje no supervisadas – con las que más familiaridad tengo es con las herramientas de BigML, compañía en la que soy asesor estratégico – asignan una puntuación a cada caso en un conjunto de datos entre 0% y 100%, y se suele considerar puntuaciones del 60% o más como valores atípicos.

En muchos casos, ese aislamiento y eliminación de valores atípicos se lleva a cabo de manera sistemática para mejorar la calidad de un conjunto de datos antes de su análisis para encontrar datos introducidos erróneamente, problemas con la lectura de instrumentos, etc., y puede generar mejoras notables en la precisión y en el rendimiento de la evaluación en los modelos de clasificación y regresión. Pero en otros casos, como las transacciones en banca o en tarjetas de crédito, la ciberseguridad, etc., este tipo de análisis sirven para identificar patrones de fraude o de intrusión, y pueden ser aplicados de manera muy rápida y sencilla.

Cada día más, avanzamos hacia escenarios en los que los datos fluyen de manera continua y pueden ser sometidos a análisis de este tipo en múltiples puntos de control. En política, por ejemplo, el uso de herramientas de este tipo podría convertirse en una muy buena forma de detectar y aislar casos de corrupción, que tienden a generar patrones irregulares. En la economía en general, la progresiva reducción del uso de dinero en metálico y el consiguiente análisis de series temporales de transacciones electrónicas también posibilitarán formas más inmediatas y directas de detectar patrones de lavado de dinero, y provocarán que los delincuentes tengan que buscar métodos más sofisticados para llevar a cabo su actividad.

El dinero negro es una importante lacra con un coste social muy elevado en todos los sentidos. Para los delincuentes, la pandemia ha representado una especie de tormenta perfecta a la hora de bloquear sus fuentes habituales de blanqueo, que coincide, además, con una mayor disponibilidad de herramientas analíticas sencillas para la detección de sus patrones de actividad. ¿Podemos contar con el interés y la voluntad política para poner este tipo de sistemas en marcha? ¿No sería este un buen caso, completamente lógico y justificado, para incrementar la adopción de herramientas de machine learning por parte de las administraciones públicas?


Puedes leer el artículo completo en: : Dinero, irregularidades… y machine learning

COMENTARIOS

Leave a Reply