Facebooktwitterlinkedin

Meta ha hecho un nuevo anuncio que busca romper las barreras del idioma presentes en todo el mundo, a través de la Inteligencia Artificial (IA), por lo que ha presentado un ambicioso proyecto: el NLLB-200, un traductor universal, capaz de traducir 200 idiomas diferentes entre los que se incluyen lenguajes minoritarios como el kambra, el lao o el igbo, hablados en diferentes zonas de África. NLLB-200 es parte de la iniciativa del gigante tecnológico denominada “No Language Left Behind”, lo que puede traducirse como «ningún idioma es dejado atrás».

La idea no es solo poder traducir los idiomas más hablados del mundo, como el inglés, español o portugués, a idiomas minoritarios, sino lograr traducciones inversas de calidad (hay expresiones propias de cada región o palabras que no tienen sentido en otro idioma) y lograr derribar una de las barreras más complicadas para las herramientas de traducción.

“Un puñado de idiomas, incluidos inglés, mandarín, español y árabe, dominan la web. Los hablantes nativos de estos idiomas ampliamente hablados pueden dar por sentado lo significativo que es leer algo en su propia lengua materna. NLLB ayudará a más personas a leer cosas en su idioma nativo, en lugar de requerir siempre un idioma intermedio que a menudo se equivoca en el sentimiento o el contenido” explica una publicación de la empresa en su blog oficial.

Antecedentes del NLLB-200

Llegar a este modelo de IA no ha sido fácil para Meta, que ha afrontado varios retos. Primero, los servicios de traducción se entrenan con datos, un entrenamiento que se basa en oraciones emparejadas entre combinaciones con otras lenguas. Pero existen muchas combinaciones que no tienen oraciones paralelas que puedan servir como traducción, por lo que las traducciones pueden tener errores gramaticales o ser incoherentes. 

Anteriormente, los investigadores de Meta desarrollaron M2M-100, un modelo de traducción de 100 idiomas, con el cual se impulsó la creación de nuevos métodos para recolectar datos y mejorar los datos. Pero este modelo no era capaz de cubrir ni la mitad de los idiomas actuales, lo que le hacía imposible que miles de usuarios pudieran entender el contenido que era publicado en Facebook e Instagram. 

El nuevo motor ha tomado un enfoque diferente: la IA tiene un sistema de aprendizaje automático impulsado por un amplio conjunto de oraciones. Al existir diferentes combinaciones posibles, la IA compara los contenidos y decide la más adecuada en el contexto.

Para lograr medir la calidad de las traducciones, Meta IA presentó su tecnología FLORES-200, un conjunto de datos de evaluación que hace posible a los investigadores evaluar el rendimiento del NLLB-200 en más de 40.000 direcciones entre diferentes idiomas.

Meta afirma que, “al comparar la calidad de las traducciones con investigaciones anteriores de IA, NLLB-200 obtuvo un promedio de 44% más alto. Para algunos idiomas africanos e indios, las traducciones de NLLB-200 fueron un 70 % más precisas”

Una nueva herramienta para democratizar el uso del metaverso

Pero Meta no quiere guardar su trabajo como un secreto, por lo que ha publicado el modelo NLLB-200 y FLORES-200 en código abierto, para que cualquier investigador pueda mejorar sus propias herramientas de traducción. Así mismo, anunció la concesión de subvenciones de hasta 200.000 dólares (196.000 euros), otorgadas a investigadores independientes u organizaciones sin fines de lucro que quieran aplicar la tecnología en iniciativas sociales.

Con esto espera que los avances de investigación puedan respaldar más de 25.000 millones de traducciones publicadas cada día en el feed de Facebook, Instagram y otras plataformas de la empresa.

Aunque aún quedan retos por enfrentar, como la falta de reglas gramaticales de algunos idiomas creados sobre la base del habla, pero este modelo de traducción promete reducir la brecha de acceso al mundo virtual y que el metaverso tenga más usos que simples interacciones o juegos.

Tal y como explica la propia empresa «A medida que el metaverso comienza a tomar forma, la capacidad de crear tecnologías que funcionen bien en una gama más amplia de idiomas ayudará a democratizar el acceso a experiencias inmersivas en mundos virtuales».

Una herramienta de traducción en tiempo real como esta podría convertirse en clave para facilitar la comunicación fluida en entornos virtuales como el metaverso, donde usuarios de diferentes países y culturas buscan interactuar de la forma más «real» posible y donde los comandos de voz forman parte de la estrategia de Zuckerberg para popularizar su uso.

Imagen blog oficial de Meta

Escribir comentario