La torre de Babel (y el machine learning como bola de demolición)
By Enrique Dans
Facebook anuncia que abandona el motor de traducción de Bing, que utilizaba desde 2011, para sustituirlo con su propio motor de traducción basado en machine learning.
Un movimiento que permite entender muchas cosas: en primer lugar, la enorme y radical importancia que el machine learning, convertido ya en auténtica ventaja competitiva sostenible, está adquiriendo en un número cada vez mayor de tareas de todo tipo. Cada vez más, contar con las herramientas adecuadas que permitan poner en marcha algoritmos reutilizables, eficientes y fáciles de utilizar se convierte en un factor fundamental para ser competitivo. Quien quiera ser parte de ese futuro, debería prepararse aprendiendo a utilizar herramientas como TensorFlow, FBLearner Flow, AzureML, WhizzML, SystemML, Amazon Machine Learning u otras afines, bloques sobre los que se construye la ingeniería y los procesos del futuro. Herramientas que indudablemente tienden a rebajar las barreras de entrada y a poner el machine learning en manos de personas que no necesariamente sean data scientists, pero que es preciso entender e interpretar en la manera adecuada, además de ser consciente de su potencial.
En segundo lugar, la enorme importancia de la base de datos, de los elementos que se utilizan para alimentar y educar a esos algoritmos. Facebook es capaz de desarrollar su motor de traducción gracias al hecho de contar con una enorme cantidad de actualizaciones traducidas y evaluadas por los usuarios, mediante un sistema sencillo de cinco estrellitas que permite que el proceso no genere pereza y se pueda generar un enorme flujo de iteraciones que procesar. Es la esencia del machine learning: cada error, cada iteración no satisfactoria, se convierte en una enseñanza para el algoritmo, en un paso más en un proceso de aprendizaje continuo de una máquina que no olvida, que absorbe el conocimiento con una eficiencia muy superior a la del cerebro humano, y que puede además suplementarse con otros procesos iterativos. A la hora de construir una base de datos con la que educar a su algoritmo, Facebook cuenta con más de dos mil millones de traducciones de actualizaciones generadas cada día, en cuarenta idiomas, en 1,800 pares lingüísticos.
Como tercera conclusión interesante, entender la traducción como una muestra de lo que significa este proceso. Todos sabemos lo que eran los motores de traducción: sistemas imperfectos que traducían palabra por palabra para generar resultados cuando menos “pintorescos” que el usuario tenía que intentar prácticamente interpretar. De ahí pasamos a sistemas capaces de evaluar un término dentro de un contexto y escoger un significado basado en él, que seguían sin ser perfectos, pero mejoraban sensiblemente el resultado. Ahora, lo que tenemos es una máquina capaz de tomar una frase, compararla con infinidad de casos anteriores convenientemente evaluados, y generar reglas dinámicas muy similares a las que un humano construiría en su cerebro para llevar a cabo una tarea similar. Un largo camino, que mejora sensiblemente el resultado, que permite trabajar con idiomas con estructuras gramaticales muy diferentes, y que permite entender el funcionamiento de muchas cosas. ¿Qué hace que un coche autónomo basado en machine learning conduzca mucho mejor que un humano? No solo el que tenga mejor visión, unos reflejos prácticamente instantáneos o que no se canse, no se distraiga, no beba y no se pique con el conductor de al lado en el semáforo, sino que además, es capaz de aprender de cualquier error y anotarlo, junto con todo el contexto que lo originó, en una memoria permanente para que no pueda volver a ocurrir.
Las empresas del futuro serán las que sean capaces de aplicar este tipo de eficiencia basada en el machine learning a todos sus procesos.
Puedes leer el artículo completo en: : La torre de Babel (y el machine learning como bola de demolición)
