¿Rap Mona Lisa? La nueva IA de Microsoft anima caras a partir de fotos

Ana Ryu/Visual China Group/Getty Images

Se ve un letrero de Microsoft en la sede de la compañía el 19 de marzo de 2023 en Seattle, Washington.


Nueva York
cnn

La Mona Lisa ahora puede hacer más que solo sonreír gracias a la nueva tecnología de inteligencia artificial de Microsoft.

La semana pasada, los investigadores de Microsoft detallaron un nuevo modelo de inteligencia artificial que desarrollaron y que puede tomar una imagen fija de una cara y un clip de audio de alguien hablando y crear automáticamente un video de apariencia realista de esa persona hablando. Los videos, que pueden crearse a partir de rostros de la vida real, así como de caricaturas o obras de arte, se completan con sincronizaciones de labios convincentes y movimientos faciales y de cabeza naturales.

En un vídeo experimental, los investigadores mostraron cómo animaron a la Mona Lisa para que recitara una canción de rap cómica de la actriz Anne Hathaway.

Los resultados del modelo de IA se denominan Vasa-1, divertidos y algo contradictorios en su realidad. Microsoft dijo que la tecnología podría usarse para la educación, «mejorando la accesibilidad para personas con dificultades de comunicación», o quizás para crear compañeros virtuales para humanos. Pero también es fácil ver cómo se podría abusar de la herramienta y utilizarla para hacerse pasar por personas reales.

Es una preocupación que va más allá de Microsoft: a medida que surgen más herramientas para crear imágenes, vídeos y clips de audio atractivos generados por IA, Los expertos están preocupados Y su mal uso puede dar lugar a nuevas formas de desinformación. A algunos también les preocupa que la tecnología pueda alterar aún más las industrias creativas, desde el cine hasta la publicidad.

READ  Esta nueva IA puede simular tu voz con solo 3 segundos de sonido

En este momento, Microsoft dijo que no planea lanzar el modelo VASA-1 al público de inmediato. La medida es similar a cómo el socio de Microsoft, OpenAI, aborda las preocupaciones circundantes. Herramienta de vídeo generada por inteligencia artificialSora: OpenAI se burló de Sora en febrero, pero hasta ahora solo lo ha puesto a disposición de algunos usuarios profesionales y profesores de ciberseguridad con fines de prueba.

«Nos oponemos a cualquier comportamiento que cree contenido engañoso o dañino para personas reales», dijeron investigadores de Microsoft en una publicación de blog. Pero agregaron que la compañía «no tiene planes de lanzar» el producto públicamente «hasta que garanticemos que la tecnología se utiliza de manera responsable y de acuerdo con las regulaciones apropiadas».

Los investigadores dijeron que el nuevo modelo de inteligencia artificial de Microsoft fue entrenado en varios videos de rostros de personas mientras hablan, y está diseñado para reconocer movimientos faciales y de cabeza naturales, incluido «movimiento de labios, expresión (sin labios), mirada y parpadeo, entre otros». » otras cosas». El resultado es un vídeo más realista cuando el VASA-1 realiza una panorámica de una imagen fija.

Por ejemplo, en un video de prueba con un clip de alguien que parecía agitado, aparentemente mientras jugaba videojuegos, la cara que hablaba tenía el ceño fruncido y los labios fruncidos.

La herramienta de IA también se puede dirigir para producir un vídeo en el que el sujeto mira en una determinada dirección o expresa una determinada emoción.

Al mirar de cerca, todavía hay signos de que los videos fueron generados por máquinas, como parpadeos poco frecuentes y movimientos exagerados de las cejas. Pero Microsoft dijo que cree que su modelo «supera significativamente» a otras herramientas similares y «allana el camino para interacciones en tiempo real con avatares realistas que imitan comportamientos conversacionales humanos».

READ  Final Fantasy 16 Dev reclama colaboración con filtraciones de juegos de PS5

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *