Jaroslaw Kutylowski habla alemán, polaco e inglés (y puede pedir una Coca-Cola en francés). Con DeepL, la herramienta de traducción impulsada por IA de su startup, puede leer y escribir en aproximadamente 30 más.

Fundada en 2017, DeepL ha desarrollado un software de traducción que, según dice, es mucho más preciso que los productos rivales ofrecidos por Google y otros, gracias a una poderosa inteligencia artificial que trabaja en concordancia con parlantes de idiomas nativos humanos.

La arquitectura de red neuronal patentada de DeepL, una técnica de aprendizaje automático que ayuda a una computadora a aprender información de la misma manera que lo hace un cerebro humano, ha sido entrenada en una vasta base de datos de texto bilingüe (traducido) y monolingüe (sin traducir) disponible públicamente en 31 idiomas diferentes, incluido chino, ruso, español e italiano.

Esa es una pequeña fracción de los 130 idiomas que puedes traducir usando Google. Pero las traducciones de DeepL están calibradas en cuanto a matices por editores humanos y hablantes de idiomas nativos. La startup emplea a 20 editores internos y más de mil traductores humanos contratados y hablantes nativos en todo el mundo para evaluar la calidad de las traducciones producidas por el modelo de DeepL y ajustarlas para que sean precisas.

“Necesitamos una gran cantidad de datos traducidos por humanos de alta calidad solo para aprender las peculiaridades de un idioma para traducir tanto texto informal como formal”, dijo Kutylowski.

DeepL cuenta con más de 10 millones de usuarios activos mensuales, 500,000 de los cuales pagan entre 9 y 59 dólares por mes. Eso incluye a los abuelos que usan DeepL para hablar con sus nietos en su idioma nativo y parejas románticas que luchan con la barrera del idioma. Pero la mayor parte del negocio de DeepL proviene de sus 20,000 clientes empresariales (Mercedes Benz, Fujitsu y la compañía ferroviaria alemana Deutsche Bahn, por nombrar algunos) que usan el software de DeepL para traducir todo, desde sitios web, contratos legales y acuerdos con clientes hasta correos electrónicos, copias de marketing y diapositivas de PowerPoint.

En enero de 2023, la startup con sede en Colonia, Alemania, recaudó alrededor de 100 millones de dólares en fondos de firmas globales de capital de riesgo, incluidas Institutional Venture Partners (IVP), Atomico y Bessemer Venture Partners, con una valoración de 1,000 millones, según Pitchbook. El CEO y fundador Kutylowski no confirmó la financiación total que su empresa ha recaudado hasta la fecha.

DeepL se ha descargado en 25 millones de dispositivos, una miseria en comparación con las más de mil millones de instalaciones de Google Translate. Pero aquellos que lo han usado elogian su precisión. Nina Gafni, una traductora profesional con sede en Washington, DC, que anteriormente trabajó para la Oficina Federal de Investigaciones como lingüista y traductora, utiliza DeepL para traducir del francés, alemán e italiano al inglés. Ella dice que si bien los sistemas de aprendizaje automático nunca son completamente perfectos en sus traducciones, los de DeepL tienen más matices culturales y son más precisos que la mayoría.

“A veces, las traducciones automáticas pueden ser demasiado literales y eso es un gran problema”, dijo Gafni. “Si estoy en una situación difícil, siento que puedo confiar mucho más en DeepL que en Google Translate”.

Es probable que se deba a la calibración humana que se aplica a la gran cantidad de subtítulos de películas, traducciones de libros y patentes y conversaciones en foros que se utilizan para entrenar a DeepL.

Lee más: Threads: Le suman más funciones a la red de Zuckerberg para tratar de retener usuarios

ESTE UNICORNIO ALEMÁN ESTÁ TRATANDO DE ENFRENTARSE A GOOGLE TRANSLATE Y CHATGPT

Akiko Taguchi, una hablante nativa de japonés que trabaja para DeepL, le dijo a Forbes que pasa la mayor parte de su tiempo asegurándose de que las traducciones de DeepL sean contextualmente correctas y que suenen humanas. “Le di a la máquina mis comentarios cuando mezclaba las formalidades utilizadas en la escritura japonesa”, dijo Taguchi a Forbes. “Ha mejorado significativamente desde entonces”.

DeepL, que surgió de una herramienta de traducción del motor de búsqueda Linguee, permite a los usuarios traducir documentos completos como PDF, Word y PowerPoint manteniendo intacto el formato. Sugiere traducciones alternativas y modificaciones tonales y permite a los usuarios crear un diccionario personalizado para especificar cómo se deben traducir ciertas palabras.

Doctorado en informática, Kutylowski estaba desarrollando la tecnología de aprendizaje automático subyacente a DeepL en 2016, al mismo tiempo que los investigadores de Google estaban trabajando en Transformers, el avance tecnológico basado en la traducción que impulsa ChatGPT. Pero a partir de ahora, DeepL no usa Transformers ni grandes modelos de lenguaje para la traducción, dijo, negándose a especificar la arquitectura exacta de DeepL. “Sabíamos que las redes neuronales iban a dominar este campo muy pronto”, dijo Kutylowski. “Estábamos convencidos de que todo lo que se usaba antes para traducir, como los métodos estadísticos, no tendría ninguna aplicación en el futuro”.

Eso está demostrando ser cierto, según Karthik Ramakrishnan, socio de IVP, que lideró la ronda de inversión Serie B de 100 millones de DeepL en enero. Hay un mercado global de 27,900 millones para servicios de traducción, y no ha sido bien aprovechado. “La gran mayoría de la traducción sigue siendo muy manual, un flujo de trabajo obsoleto heredado”, dijo Ramakrishnan. “La gente contrata proveedores de servicios lingüísticos subcontratados que tardan días o incluso semanas en obtener su contenido traducido a tiempo”.

Con sus aplausos y una valoración de mil millones de dólares, DeepL está en una posición razonable para capitalizar el mercado que Ramakrishnan ha estado observando. Pero también lo son otros. Aunque su herramienta de traducción puede no ser tan precisa como DeepL, la de Google admite 130 idiomas y está respaldada por un gigante que lleva décadas invirtiendo en IA.

Otro gran competidor tecnológico es Microsoft Translator, que admite más de 100 idiomas y dialectos y tiene grandes usuarios empresariales como Volkswagen Group. Mientras tanto, ChatGPT, el bot que podría decirse que incorporó la IA, puede traducir a 50 idiomas actualmente (pero tiene una serie de problemas de traducción que van desde alucinaciones hasta la traducción incorrecta de la jerga coloquial). Eso solo mejorará gracias a la evolución continua de los modelos de lenguaje grande líderes en la industria de su matriz OpenAI.

DeepL no tiene su propio LLM, todavía. Kutylowski le dijo a Forbes que planea construir uno internamente y combinarlo con su modelo de traducción más pequeño actual para obtener mejores resultados. Con ese fin, DeepL está desarrollando sus recursos computacionales para entrenar modelos de IA utilizando el centro de datos centrado en IA de Nvidia en Suecia. “La IA generativa es una gran oportunidad”, dijo. “Nos permitirá crear funciones además de la traducción, donde el traductor se vuelve más interactivo o dialoga más contigo”.

Este artículo fue publicado originalmente en Forbes US.

Te puede interesar: Líderes del sector automotriz acusan aumento de robos a transporte de carga en carreteras

 

Siguientes artículos

transparencia-IA-redes sociales
Medios de comunicación piden negociación sobre uso de contenidos para IA
Por

Servicios de IA como ChatGPT de OpenAI y Bard de Google, han provocado un aumento de los contenidos en línea producidos...