Meta presentó su nueva herramienta de inteligencia artificial (IA) para investigadores este martes. La compañía propietaria de Facebook, Instagram y WhatsApp, informó que la tecnología es capaz de relacionar seis fuentes de datos sensoriales: imágenes y vídeo, audio, texto, profundidad, temperatura y movimiento.
En un comunicado, Meta, la empresa que dirige Mark Zuckerberg, explicó que esta nueva herramienta de código abierto, ImageBind, facilitará que las máquinas puedan analizar simultáneamente esas diferentes informaciones, algo que describió como un "entendimiento holístico" que se acerca a las capacidades humanas.
Las máquinas equipadas con esta inteligencia artificial, según la empresa, podrán "unir" los datos sensoriales y, por ejemplo, conectar los objetos de una fotografía con su sonido, su forma en tres dimensiones o su movimiento; o bien crear imágenes basándose en ruidos.
Introducing ImageBind by Meta AI: the first AI model capable of binding data from six modalities at once. This breakthrough brings machines one step closer to the human ability to bind together information from many different senses.
— Meta AI (@MetaAI) May 9, 2023
More on this new open source work ⬇️
Meta sugirió que en el futuro la herramienta podría introducir nuevas modalidades de datos sensoriales, como "tacto, discurso, olor" e imágenes por resonancia magnética cerebrales.
A medida que esas modalidades se incrementen, aseguró la empresa, ImageBind "abrirá las compuertas" de la investigación para "diseñar o experimentar mundos inmersivos y virtuales", en una clara referencia al metaverso, que es su proyecto a largo plazo.
Hace unos meses, Meta ya presentó otra herramienta de inteligencia artificial para investigadores con código abierto, LLaMa (Large Language Model Meta AI), pero de momento no lanzó aplicaciones con potencial comercial, a diferencia de los chatbots de sus rivales tecnológicas, como ChatGPT de OpenAI.
EFE