Rask, la inteligencia artificial que traduce videos y mantiene el tono de voz original: ¿cómo usarla?

Una herramienta de IA generativa permite hacer un doblaje de voces que sorprende por su habilidad de asemejarse a la voz del hablante original y se puede usar en su versión gratuita.

Compartir esta noticia
Ondas de voz.
Ondas de voz.
Foto: Helpers

Desirée Jaimovich, La Nación/GDA
Rask es una herramienta de inteligencia artificial (IA) que se popularizó recientemente por la posibilidad de doblar la voz de un video a cualquier idioma y mantener el tono de voz original. Es una IA generativa, es decir, capaz de producir contenido nuevo a partir de los datos de entrenamiento que recibe.

Así como están el ChatGPT, de OpenAI, o Bard, de Google, para producir textos; Midjourney para hacer imágenes; o Runway para crear videos; ahora hay plataformas capaces de clonar voces.

Hace unas semanas, YouTube empezó a ofrecer el doblaje automático para sus videos con voces sintéticas, con una herramienta llamada Aloud, según informó The Verge. La diferencia es que la herramienta de YouTube funciona como un doblaje genérico, puesto que elige una voz entre un grupo de voces ya sintetizadas.

Cómo funciona el doblaje por inteligencia artificial

Para comenzar a usar Rask, simplemente hay que ingresar al sitio web y registrarse con un correo electrónico. El siguiente paso es subir un video o simplemente pegar el link a un contenido multimedia subido a YouTube.

Después, aparece una caja de diálogo, en la que se selecciona el idioma que está en el video original y luego al que se lo quiere doblar. Se debe presionar en la opción que dice “Generar” y casi en un instante se obtiene el video doblado en la lengua seleccionada.

El diferencial de esta tecnología y lo que la hace tan sorprendente es que el doblaje se hace manteniendo el tono, el ritmo y la cadencia de la voz del protagonista del video. El sistema hace una clonación casi perfecta. Otro punto para destacar es que el sistema es capaz de detectar a diferentes hablantes en un mismo video.

Está disponible para usar en 60 idiomas, que incluyen español, inglés, francés, alemán y chino. Hay una versión gratuita de prueba que permite doblar un video de hasta seis minutos de duración. Luego, hay suscripciones que van desde los US$ 49 dólares hasta los US$ 559 mensuales, que ofrecen mayor cantidad de minutos y beneficios adicionales. Las empresas también pueden solicitar el acceso a la API para tener una integración con otras soluciones tecnológicas.

Rask también ofrece otros servicios como la posibilidad de generar máscaras que se fusionan sobre el rostro original del protagonista del video, a partir de una instrucción escrita en formato de texto. Esto permite, por ejemplo, subir un video de un hombre de 30 años, sin cabello y con labios delgados, y luego escribir una "prompt" o instrucción que diga “hombre de 50 años con abundante cabellera y labios voluminosos” para que la IA haga su reconversión digital.

A su vez, la compañía está trabajando en una opción que permite generar clips cortos para redes sociales a partir de videos extensos.

El costado negativo para la industria del doblaje

Son todos beneficios para quienes le sacan el jugo a esta herramienta, pero hay un lado B: el impacto negativo, a nivel laboral, que tiene para locutores, intérpretes y traductores.

Al automatizar el doblaje y la traducción, se reduce la necesidad de contratar a quienes se dedican a hacer este tipo de servicios. Ese es el gran desafío que hoy presentan las diferentes plataformas de inteligencia artificial generativa y que no solo afecta a este tipo de trabajos, sino a muchos otros que hoy pueden absorber otras IA especializadas en la creación de textos, códigos de programación, edición de videos o fotos.

¿Encontraste un error?

Reportar

Temas relacionados

inteligencia artificialGDA

Te puede interesar