acerca

the softtek blog

Suscríbase

¡No te pierdas ninguna publicación! Suscríbete a The Softtek Blog

Los dos nuevos hitos de la IA de Google son LaMDA y MUM

Softtek

sep 1, 2021

Desde hace ya más de una década, Google no para de interesarse por el lenguaje. Recientemente, estuvieron investigando nuevas técnicas de aprendizaje automático para entender las búsquedas o en la traducción de diferentes idiomas, y esto les ha facilitado desarrollar nuevos métodos de organización de la información a través del lenguaje. Por ello, estos grandes avances supondrán una inversión y ganancias futuras inmensas.

El nuevo modelo de lenguaje para aplicaciones de diálogo, LaMDA, es su último estudio de investigación sobre la conversación. La conversación entre personas es muy volátil porque rápidamente se puede pasar de un tema de conversación a otro y esto resulta muy complejo par los agentes conversacionales modernos o los chatbots, que normalmente mantienen conversaciones lineales y definidas.

Sin embargo, LaMDA es capaz de participar en conversación de manera fluida sobre una multitud de temas de conversación, capacitando al sistema de generar nuevas maneras más naturales de interactuar con la tecnología y nuevas aplicaciones.

Junto con modelos de lenguaje inteligente recientes como el GPT-3 o el BERT, LaMDA lleva desarrollándose mucho tiempo y se basa en Transformer, una arquitectura de red neuronal de Google Research y de código abierto. Así pues, es esta arquitectura la que permite entrenar el modelo para la lectura del lenguaje, la relación de las palabras entre sí y, en consecuencia, la predicción del lenguaje.

La diferencia que presenta LaMDA respecto a otros nuevos lenguajes es que este ha sido entrenado mediante el diálogo, con características como la sensatez y diferentes matices que distinguen una conversación de otro tipo de formas de lenguaje.

Por tanto, Google desde 2020, está presentando modelos de lenguaje basados en Transformer, basados en el dialogo. Estos modelos son capaces de hablar prácticamente de cualquier cosa y, especialmente LaMDA puede corregirse y ajustarse a la especificidad de sus respuestas.

A su vez, y con más lentitud, Google esta desarrollando MUM. Este es un modelo que promete ser la revolución de BERT (el actual modelo de búsqueda que usa Google), basado también en la arquitectura Transformer, para responder preguntas complejas en más de 75 idiomas y poder entender mejor el contexto de cada tema.

¿Cómo funciona LaMDA?

El funcionamiento de los asistentes de voz de hoy en día tienen las respuestas programadas para poder funcionar. Además, la dificultad de la IA de estos es que le es complicado mantener una conversación no lineal. Las conversaciones humanas no van de un punto A a un punto B, sino que tocan diferentes temas, surgiendo caminos de conversación inesperados, teniendo en cuenta de dónde vienen. Por ello, aunque los asistentes sean cada vez más sofisticados, todavía se basan en sistemas simples de conversación.

LaMDA presta especial atención en corregir este aspecto buscando la sensatez en cualquier conversación y se caracteriza por ser lo suficientemente flexible como para controlar cualquier eje de dirección en la que el usuario pueda dirigir dicha conversación.

Sin embargo, los asistentes de voz no es su única aplicación, LaMDA podría aplicarse a los chatbots, sobre todo para aquellos sitios web dirigidos a la atención del cliente. Un modelo adecuado y mejorado de IA siempre proporcionara una mejor customer experience.

A pesar de ello, LaMDA aún no está listo para introducirse en el mercado, pues aún se deben trabajar elementos como el interés y la realidad, buscando combatir el sesgo presente en la IA, un problema constante en la IA y el Machine Learning. Dicho de otro modo, la IA, en ocasiones, prioriza raza, género o religión, sin brindar de una igualdad de condiciones a todos los usuarios.

Por tanto, Google está dando grandes pasos en esta dirección en cuestión del sesgo, y sobre todo en el ámbito lingüístico, pero todavía tienen que avanzar para poder conseguir el perfeccionamiento del sistema.

¿Qué se espera lograr con LaMDA?

La sensatez y la especificidad son las principales características de este lenguaje. Sin embargo, sus creadores están explorando otras dimensiones como puede ser el “interés”, es decir, están midiendo si las respuestas que este genera son ingeniosas e inesperadas. Asimismo, hay un especial interés en la objetividad, investigándose formas en las que el lenguaje no solo sea convincente, sino que sea correcto.

El lenguaje es la mayor herramienta de comunicación de la que dispone el ser humano, pero como todo puede hacerse un mal uso de él, y es importante comprobar si LaMDA cumple con los principios de la IA. Hasta ahora, casi todos los lenguajes inteligentes se han encontrado con que se puede hacer un uso indebido de ellos, mediante los prejuicios, usando un discurso de odio o replicando falsa información.

Google junto con otras compañías, continúan trabajando al máximo para crear tecnologías como LaMDA, donde se minimicen estos riesgos. Estas grandes empresas están acostumbradas a los problemas de sesgo injusto que se genera en muchas ocasiones con el aprendizaje automático, al llevar muchos años trabajando con ello. Por esto, Google ha decidido crear sus modelos de código abierto para que los diferentes investigadores puedan usar y analizar los modelos. Así pues, LaMDA se ha analizado en cada paso de su desarrollo para ir incorporando habilidades de conversación poco a poco.

Obviamente, todos los éxitos obtenidos con este lenguaje y todas sus capacidades de conversación, Google las incluirá en su asistente, por lo que promete un nuevo enfoque conversacional que busca interpretar de una manera más eficaz la interacción humana.

El primer caso de uso

LaMDA ha llamado la atención de los medios de comunicación tras realizar una primera conversación, donde adoptaba el papel del planeta Plutón y contestaba como si fuese un planeta. Tras esa primera conversación, se realizó otra, donde la IA era un avión de papel. En ambas situaciones, las conversaciones fueron fluidas y se determinó que las palabras clave no destacan de las demás de la conversación, obteniéndose muy buenos resultados de coherencia.

Las conclusiones de esta primera toma de contacto son impresionantes, sobre todo en el ámbito de la facilidad de adaptación a cualquier tema de conversación, siendo esta sensata, fluida e interesante. No obstante, esta es una primera prueba y el lenguaje sigue en investigación.

El fin principal de Google es cambiar la opinión que generan los chatbots, transformar una interacción rígida y fría en una conversación más fluida y productiva, pudiendo generar una mejor customer experience.

Tras las pruebas, Google asegura que LaMDA entiende más matices que los algoritmos actuales, además, de ser capaz de evitar dar respuestas repetitivas y comprender el contexto de la conversación.

MUM: el siguiente hito para comprender la información

Paralelamente, MUM es un modelo capaz de transformar la manera en que Google ayuda con tareas complejas en más de 75 idiomas, generando respuestas coherentes. Este es un sistema que funciona a partir de texto e imágenes, considerándose el algoritmo más potente de los creados por Google.

MUM viene de las siglas Multitask Unified Model y asegura ser la revolución de BERT, la red neuronal actual empleada en las búsquedas de Google. El nuevo modelo está basado también en la arquitectura Transformer.

Asimismo, la compañía asegura que el modelo responderá complejas preguntas y entiende mejor el contexto asociado a cada tema. El fin principal de MUM es eliminar la barrera del idioma encontrando de una manera más eficiente la información y con un contenido más adecuado independientemente del idioma en el que se realice la búsqueda.

Mediante este modelo se buscará que la información sea lo más precisa posible independientemente de la información disponible en el idioma en el que se realice la búsqueda. Por ejemplo, aunque se busque información en español sobre temas que solo existan paginas en chino, MUM facilitara toda la información sobre ese tema en el idioma que esté disponible.

Además, al ser multimodal, será capaz de asociar el texto a imágenes y videos, es decir, también se podrán realizar búsquedas y consultas a partir de imágenes. Google afirma que MUM tiene la capacidad de asociar el contexto de los dos formaros y dar una respuesta acorde a ellos.

Conclusiones

Así pues, actualmente, la IA conversacional y la IA de búsqueda se encuentran en proceso de desarrollo por parte de Google. Las presentaciones realizadas por la compañía son un adelanto de lo que podría llegar en el ámbito de la IA, con unas soluciones prometedoras.

LaMDA ayudará a numerosas empresas a transformas su customer experience mediante el acercamiento a las conversaciones reales del ser humano en sus chatbots, donde además se está poniendo gran hincapié en corregir los grandes problemas de la IA como el sesgo y explorando nuevas dimensiones como el interés por parte del modelo.

Por último, al mismo tiempo Google ha presentado MUM, un modelo del futuro sistema neuronal para las búsquedas de Google, donde se responderá con mayor facilidad a preguntas complejas en diferentes idiomas, entendiendo el contexto asociado a la cuestión.

the softtek blog

Categorías

the softtek blog

Los dos nuevos hitos de la IA de Google son LaMDA y MUM

¿Cómo funciona LaMDA?

¿Qué se espera lograr con LaMDA?

El primer caso de uso

MUM: el siguiente hito para comprender la información

Conclusiones