Tecnologías para implementación de chatbots neuronales evolutivos en escenarios con datos de entrenamiento limitados
El proyecto neuroLagun II nace para afrontar retos que se han puesto de manifiesto en el desarrollo del proyecto neuroLagun y que siguen siendo uno de los grandes problemas de la Inteligencia Artificial. Para enseñar bien a un sistema de inteligencia artificial es necesario disponer de mucha información para entrenarlo y la realidad es que no se dispone de ellos. Este hecho, hace que la expansión o implantación de las soluciones en entornos reales sean difíciles y no obtengan los resultados que el usuario final espera. En el proyecto neuroLagun se avanzó en esta línea, pero se ha visto que es necesario ahondar en la línea de trabajo todo lo posible para conseguir buenos resultados partiendo de una cantidad limitada de datos de entrada si se quiere llegar a una solución comercializable.
Los chatbots pueden ser entrenados exponencialmente más rápido que los humanos, están disponibles 24/7 y reaccionan instantáneamente a las consultas de los usuarios. Además, las administraciones públicas pueden ahorrar una enorme cantidad de recursos gracias a la disminución de las consultas de los usuarios a operadores humanos (por ejemplo, a través del servicio de asistencia técnica). Otra gran ventaja de la utilización de esta tecnología es que facilita el acceso de los ancianos, los enfermos y los discapacitados a los servicios públicos. Los «chatbots» pueden reducir las barreras para contactar o pedir ayuda a las administraciones públicas.
- Desarrollo de pipeline bilingüe para sistemas conversacionales: Pipeline capaz de asistir en trámites a través de diálogos en castellano y euskera.
- Desarrollo de tecnología basada en deep learning: Se desarrollaron modelos neuronales bilingües para los principales procesos de los sistemas de diálogos: clasificación de intenciones, extracción de entidades, pregunta-respuesta y gestión del diálogo.
- Desarrollo de metodología para adaptabilidad optimizada a dominio: La tecnología se adaptó al escenario de administración de actividades deportivas municipales, y se desarrolló una metodología que facilitaba adaptar los modelos a nuevos escenarios.
En neuroLagun II nos centraremos en los aspectos de la adaptabilidad y en el ahorro de recursos a la hora de desarrollar chatbots para escenarios multilingües de recursos limitados dentro del ámbito de la administración. Las aportaciones científicas que se realizarán son las siguientes::
- Investigación y desarrollo de técnicas de data augmentation para expandir conjuntos de datos de entrenamiento para generar modelos neuronales de chatbots. Los modelos neuronales requieren grandes volúmenes de datos de entrenamiento que no son abordables en escenarios de recursos limitados.
- Investigación y desarrollo de técnicas de lifelong learning que permitan la mejora mediante retroalimentación de chatbots bilingües orientados a escenarios de recursos limitados.
- Investigación y desarrollo de nuevas técnicas de transfer learning para adaptación de dominio de chatbots bilingües orientados a escenarios de recursos limitados. Estas técnicas permitirán reaprovechar en un escenario el conocimiento aprendido por el chatbot neuronal en otro escenario.
Colaboración: Elhuyar Fundazioa

Financiación: Diputación Foral de Gipuzkoa