Meta, la firma de Mark Zuckerberg, presentó este martes su tecnología SeamlessM4T, la cual presumió como el primer modelo de traducción y transcripción de inteligencia artificial (IA) multimodal y multilingüe.

Esta IA puede realizar traducciones de voz a texto, de voz a voz, de texto a voz y de texto a texto hasta en 100 idiomas, según la tarea.

SeamlessM4T permite el uso de las siguientes herramientas:

  • Reconocimiento de voz para casi 100 idiomas
  • Traducción de voz a texto para casi 100 idiomas de entrada y salida
  • Traducción de voz a voz, compatible con casi 100 idiomas de entrada y 36 idiomas de salida (incluido el inglés)
  • Traducción de texto a texto para casi 100 idiomas
  • Traducción de texto a voz, compatible con casi 100 idiomas de entrada y 35 idiomas de salida (incluido el inglés)

“De acuerdo con nuestro enfoque de ciencia abierta, lanzaremos públicamente SeamlessM4T bajo una licencia de investigación para permitir a los investigadores y desarrolladores desarrollar este trabajo. También estamos publicando los metadatos de SeamlessAlign, el conjunto de datos de traducción multimodal abierto más grande hasta la fecha, con un total de 270,000 horas de alineaciones de voz y texto extraídas”, apuntó Meta en su blog oficial.

“En comparación con los enfoques que utilizan modelos separados, el enfoque de sistema único de SeamlessM4T reduce los errores y las demoras, aumentando la eficiencia y la calidad del proceso de traducción. Esto permite que las personas que hablan diferentes idiomas se comuniquen entre sí de forma más eficaz”, añadió.

La compañía matriz de Facebook recordó que previamente ha diseñado herramientas de lenguaje como No Language Left Behind (NLLB), un modelo de traducción automática de texto a texto que admite 200 idiomas y que se ha integrado a Wikipedia como uno de los proveedores de traducción; Universal Speech Translator, que fue el primer sistema de traducción directa de voz a voz para Hokkien, un idioma sin un sistema de escritura ampliamente utilizado, y Massively Multilingual Speech, que proporciona reconocimiento de voz, identificación de idiomas y tecnología de síntesis de voz en más de 1,100 idiomas.

Lee: NLLB-200, la inteligencia artificial de Meta capaz de traducir a 200 idiomas

“SeamlessM4T se basa en los hallazgos de todos estos proyectos para permitir una experiencia de traducción multilingüe y multimodal derivada de un único modelo, construido en una amplia gama de fuentes de datos hablados con resultados de última generación”, destacó.

¿Ya nos tienes en Facebook? Danos like y recibe la mejor información

 

Siguientes artículos

Google-imágenes-IA
Justicia de EU determina que los derechos de autor no protegen el arte creado por IA
Por

El caso comenzó por una demanda presentada por el dueño de un software que generó una pieza visual a través de IA y exig...