Neurolagun II

2021 - 2022

Tecnologías para implementación de chatbots neuronales evolutivos en escenarios con datos de entrenamiento limitados

El proyecto neuroLagun II nace para afrontar retos que se han puesto de manifiesto en el desarrollo del proyecto neuroLagun y que siguen siendo uno de los grandes problemas de la Inteligencia Artificial. Para enseñar bien a un sistema de inteligencia artificial es necesario disponer de mucha información para entrenarlo y la realidad es que no se dispone de ellos. Este hecho, hace que la expansión o implantación de las soluciones en entornos reales sean difíciles y no obtengan los resultados que el usuario final espera. En el proyecto neuroLagun se avanzó en esta línea, pero se ha visto que es necesario ahondar en la línea de trabajo todo lo posible para conseguir buenos resultados partiendo de una cantidad limitada de datos de entrada si se quiere llegar a una solución comercializable.

El proyecto neuroLagun inicial tenía como objetivo la investigación y desarrollo de tecnología base para implementar sistemas conversacionales bilingües orientados a la asistencia en trámites de la administración en el contexto del País Vasco. Los sistemas conversacionales o chatbots desarrollados sobre la tecnología base a desarrollar tenían que ser capaces de asistir de forma eficaz al usuario en la ejecución de trámites administrativos mediante diálogos en lenguaje natural y teniendo en cuenta el contexto del diálogo.

Los chatbots pueden ser entrenados exponencialmente más rápido que los humanos, están disponibles 24/7 y reaccionan instantáneamente a las consultas de los usuarios. Además, las administraciones públicas pueden ahorrar una enorme cantidad de recursos gracias a la disminución de las consultas de los usuarios a operadores humanos (por ejemplo, a través del servicio de asistencia técnica). Otra gran ventaja de la utilización de esta tecnología es que facilita el acceso de los ancianos, los enfermos y los discapacitados a los servicios públicos. Los «chatbots» pueden reducir las barreras para contactar o pedir ayuda a las administraciones públicas.

Sin embargo, los sistemas chatbot del mercado presentan notables deficiencias cuando se aplican en contextos o escenarios determinados ya que los sistemas de conocimiento o modelos sobre los que están construidos no están adaptados a las características de esos escenarios como pueden ser los tipos de diálogo, las intenciones, los parámetros de éstas y el idioma en el que se establecen los diálogos.
En neuroLagun trabajamos diferentes líneas de investigación para abordar los problemas mencionados anteriormente centrándonos en el contexto concreto de los trámites administrativos en el ámbito geográfico del País Vasco. Se realizaron las siguientes aportaciones científico-técnicas:
  1. Desarrollo de pipeline bilingüe para sistemas conversacionales: Pipeline capaz de asistir en trámites a través de diálogos en castellano y euskera.
  2. Desarrollo de tecnología basada en deep learning: Se desarrollaron modelos neuronales bilingües para los principales procesos de los sistemas de diálogos: clasificación de intenciones, extracción de entidades, pregunta-respuesta y gestión del diálogo.
  3. Desarrollo de metodología para adaptabilidad optimizada a dominio: La tecnología se adaptó al escenario de administración de actividades deportivas municipales, y se desarrolló una metodología que facilitaba adaptar los modelos a nuevos escenarios.

En neuroLagun II nos centraremos en los aspectos de la adaptabilidad y en el ahorro de recursos a la hora de desarrollar chatbots para escenarios multilingües de recursos limitados dentro del ámbito de la administración. Las aportaciones científicas que se realizarán son las siguientes::

  1. Investigación y desarrollo de técnicas de data augmentation para expandir conjuntos de datos de entrenamiento para generar modelos neuronales de chatbots. Los modelos neuronales requieren grandes volúmenes de datos de entrenamiento que no son abordables en escenarios de recursos limitados.
  2. Investigación y desarrollo de técnicas de lifelong learning que permitan la mejora mediante retroalimentación de chatbots bilingües orientados a escenarios de recursos limitados.
  3. Investigación y desarrollo de nuevas técnicas de transfer learning para adaptación de dominio de chatbots bilingües orientados a escenarios de recursos limitados. Estas técnicas permitirán reaprovechar en un escenario el conocimiento aprendido por el chatbot neuronal en otro escenario.

Colaboración: Elhuyar Fundazioa

Financiación: Diputación Foral de Gipuzkoa