Google ha anunciado el desarrollo de Translatotron, su nuevo sistema automatizado de traducción de forma simultánea capaz de traducir
voz-a-voz sin necesidad de utilizar texto de por medio .

Es el primer sistema en su tipo y utiliza un modelo de punto a punto que no depende del uso de texto de por medio. Este enfoque es más preciso que el modelo de cascada, que involucra el reconocimiento de voz para capturar el texto, traducirlo y convertirlo a voz nuevamente.

Modelo de arquitectura de Translatron.

Así lo han anunciado los ingenieros de programas de Google Ye Jia y Ron Weiss en el blog de inteligencia artificial de la google este nuevo paso en la traducción simultánea, que intenta evitar el paso intermedio de leer la conversación (aunque esta se puede desplegar en los dispositivos de prueba por si se ha desoído una parte), aumentar de esta forma la velocidad de la interacción, obviar palabras que no necesitan traducción (como pronombres implícitos en la persona del verbo en castellano) y, especialmente, aprender del sistema de voz para evitar errores e imitarlo.

La empresa ha compartido los primeros resultados de Translatotron utilizando una traducción de español a inglés con distintos acentos. En algunos casos la traducción es precisa, sobre todo en frases cortas. El sistema todavía necesita trabajo en frases en las que el sujeto habla bajo o simplemente no sabe expresar correctamente la idea.

Pueden ver las pruebas y escuchar los audios desde este enlace.

Desde la empresa argumentan que la calidad de traducción del Translatotron todavía no supera a lo conseguido por un sistema de cascada convencional, aunque menciona que han consegido demostrar la viabilidad de la traducción directa voz-a-voz de extremo a extremo.