Desirée Jaimovich, La Nación/GDA
Rask es una herramienta de inteligencia artificial (IA) que se popularizó recientemente por la posibilidad de doblar la voz de un video a cualquier idioma y mantener el tono de voz original. Es una IA generativa, es decir, capaz de producir contenido nuevo a partir de los datos de entrenamiento que recibe.
Así como están el ChatGPT, de OpenAI, o Bard, de Google, para producir textos; Midjourney para hacer imágenes; o Runway para crear videos; ahora hay plataformas capaces de clonar voces.
Hace unas semanas, YouTube empezó a ofrecer el doblaje automático para sus videos con voces sintéticas, con una herramienta llamada Aloud, según informó The Verge. La diferencia es que la herramienta de YouTube funciona como un doblaje genérico, puesto que elige una voz entre un grupo de voces ya sintetizadas.
Cómo funciona el doblaje por inteligencia artificial
Para comenzar a usar Rask, simplemente hay que ingresar al sitio web y registrarse con un correo electrónico. El siguiente paso es subir un video o simplemente pegar el link a un contenido multimedia subido a YouTube.
Después, aparece una caja de diálogo, en la que se selecciona el idioma que está en el video original y luego al que se lo quiere doblar. Se debe presionar en la opción que dice “Generar” y casi en un instante se obtiene el video doblado en la lengua seleccionada.
Our website may be a little slower than normal at the moment. Because we're so damn #popular, sorry.
— rask.ai (@rask_ai) September 14, 2023
But our team is working on speeding things up and we'll be fast again in the very near future.
In the meantime, a reminder to our #competitors - I AM THE DANGER@BreakingBad… pic.twitter.com/OnLwuZM8Xm
El diferencial de esta tecnología y lo que la hace tan sorprendente es que el doblaje se hace manteniendo el tono, el ritmo y la cadencia de la voz del protagonista del video. El sistema hace una clonación casi perfecta. Otro punto para destacar es que el sistema es capaz de detectar a diferentes hablantes en un mismo video.
Está disponible para usar en 60 idiomas, que incluyen español, inglés, francés, alemán y chino. Hay una versión gratuita de prueba que permite doblar un video de hasta seis minutos de duración. Luego, hay suscripciones que van desde los US$ 49 dólares hasta los US$ 559 mensuales, que ofrecen mayor cantidad de minutos y beneficios adicionales. Las empresas también pueden solicitar el acceso a la API para tener una integración con otras soluciones tecnológicas.
Our entire team watched the #AppleEvent. Mother Nature is truly incredible. That's why we helped the @Apple team & @tim_cook and #MotherNature speak in different languages in this scene!
— rask.ai (@rask_ai) September 13, 2023
By the way, the joke about @TedLasso was spot-on 🤣#Iphone15 #apple #Sustainability pic.twitter.com/Tp0nGBWbFc
Rask también ofrece otros servicios como la posibilidad de generar máscaras que se fusionan sobre el rostro original del protagonista del video, a partir de una instrucción escrita en formato de texto. Esto permite, por ejemplo, subir un video de un hombre de 30 años, sin cabello y con labios delgados, y luego escribir una "prompt" o instrucción que diga “hombre de 50 años con abundante cabellera y labios voluminosos” para que la IA haga su reconversión digital.
A su vez, la compañía está trabajando en una opción que permite generar clips cortos para redes sociales a partir de videos extensos.
El costado negativo para la industria del doblaje
Son todos beneficios para quienes le sacan el jugo a esta herramienta, pero hay un lado B: el impacto negativo, a nivel laboral, que tiene para locutores, intérpretes y traductores.
Al automatizar el doblaje y la traducción, se reduce la necesidad de contratar a quienes se dedican a hacer este tipo de servicios. Ese es el gran desafío que hoy presentan las diferentes plataformas de inteligencia artificial generativa y que no solo afecta a este tipo de trabajos, sino a muchos otros que hoy pueden absorber otras IA especializadas en la creación de textos, códigos de programación, edición de videos o fotos.