¿La máquina de la verdad… algorítmica?
By Enrique Dans
Mi columna en Invertia de esta semana se titula «Usando la IA para saber qué dicen realmente los directivos» (pdf), y es un intento de explicar cómo funciona el machine learning y la algoritmia generativa utilizando un ejemplo que me pareció como mínimo interesante: la posibilidad de entrenar un algoritmo que ya maneja perfectamente el lenguaje con grabaciones de presentaciones de resultados trimestrales hechas por directivos de compañías, y etiquetarlas con los resultados que esas compañías mostraron algunos períodos después.
La idea, obviamente, es construir una especie de «máquina de la verdad», como en algunos programas de telebasura, pero con una base estadística que, aunque pueda variar en función de las habilidades de quien está presentando, sí puede llegar a obtener predicciones derivadas de cuestiones como el uso de las llamadas filler words o muletillas («esto», «eeeeh», «bueno», «pues»…) que evidencian que alguien no está seguro de lo que dice o que está, aparentemente, ocultando información.
La idea no es basarse en esa variable, que por otro lado resulta fácilmente observable – hacerlo así sería el equivalente a la programación clásica – sino dejar que el machine learning, con un número de datos suficiente, descubra sus propias correlaciones y termine siendo mucho más certero a la hora de predecir resultados que lo que ningún observador entrenado podría llegar a ser.
El ejemplo, que resulta potencialmente cuestionable desde un punto de vista ético y que podría producir resultados directamente alucinógenos si lo aplicásemos, por ejemplo, a los discursos de los políticos, no es la cuestión. La cuestión es mostrar cómo cualquier evento generador potencial de datos que dé lugar a un número razonablemente representativo de casos y que pueda correlacionarse con variables dependientes, como es el caso con los discursos de presentación de resultados – que ocurren constantemente – y con los resultados posteriores de las compañías – que son públicos y pueden recopilarse fácilmente – es susceptible de ser utilizado para entrenar un algoritmo, y por tanto, de generar una máquina capaz de predecir resultados en función de un nuevo dato introducido en ella.
Simplemente, un caso más. Pero con su punto interesante.
Puedes leer el artículo completo en: : ¿La máquina de la verdad… algorítmica?