Artigas y Gardel en movimiento: el detrás de escena de la inteligencia artificial que los “revive”

La aplicación Deep Nostalgia utiliza una decena de videos pregrabados para la animación

Tiempo de lectura: -'

17 de marzo de 2021 a las 05:04

Estás por alcanzar el límite de notas.

Suscribite ahora a

Pasá de informarte a formar tu opinión.

Suscribite desde US$ 3 45 / mes

Esta es tu última nota gratuita.

Se parte de desde US$ 3 45 / mes

Gonzalo Martínez - Especial para Cromo

Artigas moviendo la cara y cerrando los ojos. Gardel pestañeando. Batlle con una pequeña sonrisa y Aparicio Saravia observando a su alrededor. Cientos de usuarios recreando fotos de familiares fallecidos para recordar alguna mueca o un simple movimiento.

En los últimos días, una app llamada Deep Nostalgia inundó las redes sociales con mini videos de rostros animados a partir de fotografías estáticas.

La hasta ahora desconocida aplicación fue creada por la compañía MyHeritage, experta en la elaboración de árboles genealógicos a partir de archivos y documentos, y consiste en recrear una representación de los gestos de una persona previo a ser fotografiado, en un formato de video.

¿Cómo logra semejante nivel de realismo? La explicación del sitio web es bastante escueta. Sin demasiadas aclaraciones, asegura que utiliza la licencia de una empresa especializada en la reconstrucción de video, empleando el aprendizaje profundo o deep learning.

La app despertó el interés de muchos usuarios y de gente especializada en el área. El ingeniero en computación y líder técnico de Idatha, Emiliano Viotti, explicó a Cromo que este campo "explora el uso de las redes neuronales artificiales en conjunto con grandes volúmenes de datos" y que la idea por detrás del concepto de deep learning es que "cuanto más compleja es una red neuronal, más poder tiene para entender relaciones interesantes o complejas en los datos", entre ellas, las imágenes y videos.

Sin embargo, el especialista aseguró que "decir que la app usa deep learning es como decir que simplemente usa tecnología", pero que por ingeniería inversa se pueden obtener algunas conclusiones sobre el funcionamiento de tan llamativa aplicación, de acuerdo a pruebas que el experto realizó con Rodrigo Laguna, otro ingeniero de Idatha que se interesó en la aplicación.

Según explicó Viotti, Deep Nostalgia utiliza una amplia gama de decenas de videos pregrabados con diferentes gestos y posiciones: mirando hacia arriba, hacia abajo, con la cara más hacia la izquierda o la derecha. Todos esos clips utilizan "movimientos calculados y sutiles, como pestañear, mover un poco la nariz o la boca" y funcionan como una gran base de datos, dijo Viotti.

Lo sorpresivo ocurre después. Cuando el usuario carga la imagen que quiere animar, la inteligencia artificial detecta la posición del rostro subido y selecciona uno de los videos precargados para animar esa imagen. El criterio, explicó Viotti, es buscar el que "está más cerca o que más se le parece en la posición o postura de la cara, en comparación con la cara que está en la foto que la persona sube".

En otras palabras, si alguien carga una imagen con una inclinación determinada de la cabeza y con la mirada hacia abajo, el sistema busca, en su catálogo, aquel que sea más parecido a esas condiciones. Luego, simplemente, traduce los movimientos de la cara del video a la fotografía subida por el usuario y el resultado es un video animado con los mismos gestos que el clip base.

Los riesgos de esta tecnología

Aunque la aplicación está pensada "para uso nostálgico" y su página web solicita que se utilicen fotos propias "y no en fotos con personas vivas sin su permiso", la inteligencia artificial que utiliza esta tecnología tiene algunos riesgos.

Si bien hacer clips sin autorización puede ser un problema, las técnicas para manipular y crear video de forma artificial con rostros de personas —lo que se conoce popularmente como deep fake— pueden ser, particularmente, aún más peligrosas.

Viotti explicó que la tecnología de Deep Nostalgia gira entorno básicamente a los datos y "cuanto más tiene más preciso es el resultado".

"Si yo me pongo a entrenar un modelo tomando fotos con diferentes ángulos, tipos de iluminación y condiciones durante bastante tiempo, es muy posible generar imágenes muy realistas", aseguró a Cromo.

Dentro de las peligrosas técnicas, según Viotti, existen tareas como el "face reenactment" que consiste en "la generación digital y automática de un rostro artificial" cumpliendo dos condiciones: transfiriendo los movimientos y gestos de una cara a otra; y preservando la apariencia e identidad de la cara de destino.

"El resultado es un nuevo video a partir de una foto en los que se ven los gestos y movimientos del video pero ya no la cara que aparecía en el origen ni el contexto que lo rodeaba", explicó el ingeniero.

Un buen ejemplo de esta peligrosa posibilidad tecnológica tuvo como protagonista al expresidente Barack Obama, en un video falso creado con inteligencia artificial y difundido en 2017.

Otro de los riesgos es el del "face swap" que "es como grabar un video o sacarse una foto utilizando la careta de otra persona" copiando las expresiones faciales y mezclándose "perfectamente en nuestro rostro de tal forma que quien ve el resultado no se da cuenta que es un video o imagen falso", dijo Viotti.

La cuenta de TikTok, deeptomcruise, utiliza de hecho esta tecnología y sus impresionantes videos tienen más de 700 mil seguidores.

CONTENIDO EXCLUSIVO Member

Esta nota es exclusiva para suscriptores.

Accedé ahora y sin límites a toda la información.

¿Ya sos suscriptor?
iniciá sesión aquí

Alcanzaste el límite de notas gratuitas.

Accedé ahora y sin límites a toda la información.

Registrate gratis y seguí navegando.