¿Se rompen los límites de las lenguas? ¿Vamos a poder hablar con cualquier otra persona de otro país o continente sin saber nada de su idioma? ¿Estamos a un paso de vivir lo que veíamos en películas de ciencia ficción?

Parece que sí. Facebook está llevando adelante, junto con un equipo de investigación de inteligencia artificial, el desarrollo un sistema de traducción de idiomas mejorado , que, en este momento, puede traducir hasta 128 idiomas diferentes al inglés con una sola aplicación.

Este 18 de noviembre, Facebook lanzó XLS-R:

XLS-R es un nuevo modelo auto supervisado para una variedad de tareas de habla. XLS-R mejora sustancialmente los modelos multilingües anteriores al entrenar en casi 10 veces más datos públicos en más del doble de idiomas.

Como explican desde su blog, este sistema XLS-R:

“ Formado en más de 436.000 horas de grabaciones de voz disponibles al público, XLS-R se basa en wav2vec 2.0, nuestro enfoque para el aprendizaje autodirigido de representaciones de voz. Utilizando datos de voz de diferentes fuentes, que van desde procedimientos parlamentarios hasta audiolibros, nos hemos expandido a 128 idiomas diferentes, cubriendo casi dos veces y media más idiomas que su predecesor «.

De hecho, Facebook dice que probó XLS-R contra cuatro importantes puntos de referencia de reconocimiento de voz multilingües, en los que superó sus resultados en la mayoría de los idiomas probados.

Afirman que lo probaron en cinco idiomas de BABEL, 10 idiomas de CommonVoice, ocho idiomas de MLS y los 14 idiomas de VoxPopuli.

Como puede ver aquí, las tasas de error para estos sistemas siguen siendo relativamente altas para algunos idiomas, pero el XLS-R muestra una marcada mejora en la precisión, que Facebook sigue mejorando a medida que desarrolla el proceso.

Eso eventualmente podría abrir una gama de nuevas aplicaciones, incluida la conexión transfronteriza y el comercio, ampliando las oportunidades para las empresas en todo el mundo.

Facebook también señala que tales sistemas podrían ser de gran valor en sus futuras aplicaciones de metaverso, facilitando una conexión más universal en estas comunidades digitales de mundo abierto.

En palabras finales, Facebook señala que:

Mejora el rendimiento del reconocimiento de voz y más del doble de precisión en la traducción de voz del extranjero al inglés. XLS-R es un paso importante hacia un modelo único que puede comprender el habla en muchos idiomas diferentes y es el esfuerzo más grande que conocemos para aprovechar los datos públicos para la capacitación previa multilingüe.

Como se señaló, Facebook todavía está desarrollando el sistema, y ​​Facebook también señala que se hablan más de 7,000 idiomas en el mundo, por lo que está muy lejos de ser un traductor verdaderamente universal.