Nueva tecnología de sincronización labial puede «inventar» vídeos

En esta era de políticos adictos a la post-verdad y la falacia del ad hominem, un nuevo proyecto bajo el ala de la Universidad de Washington creó algoritmos que generan vídeos con una sincronización de labios muy avanzada, a partir de un simple clip de audio. El ojo entrenado detectará errores en el proceso sin dificultades, pero ese no es el punto. Después de todo, lo único que se necesita es una simulación lo suficientemente buena, y repetirla hasta el cansancio…

Para aquellos que aún no han leído «1984» de George Orwell, el personaje de Winston Smith es un editor en el Ministerio de la Verdad encargado de realizar revisionismo histórico, o sea, alterar registros previos con el objetivo de adaptarlos a la visión y la voluntad del Estado. En la actualidad, la creencia de que «nadie sobrevive al archivo» se mantiene firme, pero si sumamos la posibilidad de editar el archivo o crearlo desde cero que habilita la digitalización, separar a la verdad de la mentira se vuelve mucho más difícil. Dicho eso, un nuevo proyecto de la Universidad de Washington demuestra el asombroso poder de las redes neurales aplicado al procesamiento visual y la sincronización labial. También nos deja preocupados.

Básicamente, lo que hace el software es generar movimientos labiales y bucales precisos a partir de un clip de audio, para luego colocarlos sobre el rostro de una persona en un vídeo preexistente. Los responsables del proyecto dicen que esta «conversión realista de audio a vídeo» posee aplicaciones prácticas como la optimización de videoconferencias (en vez de transmitir una señal de vídeo entera, se recibe sólo el audio y un modelo local nos «habla»), o en un futuro no muy lejano, mantener una conversación con figuras históricas y actores vía realidad virtual. ¿Por qué escogieron a Barack Obama? Una simple cuestión de material disponible. La red neural necesita ser entrenada, y hay una enorme cantidad de vídeos del ex presidente en dominio público.

No, la sincronización no es perfecta y sus creadores lo saben, pero es cuestión de tiempo para que los efectos del Valle Inquietante queden atrás. Ahora, la red neural sólo puede ser entrenada con los datos de una sola persona a la vez. De acuerdo con el profesor y coautor Steve Seitz, «no es posible» tomar la voz de cualquiera y transformarla en un vídeo del presidente Obama. Sin embargo, si nos guiamos por los comentarios en los vídeos (uno ya los tiene deshabilitados), la gente piensa distinto.

Anuncio oficial:Haz clic aquí

Nueva tecnología de sincronización labial puede «inventar» vídeos

El Ministerio de la Verdad se está frotando las manos

Escrito por Lisandro Pardo

Los mejores clientes de correo electrónico gratuitos

Google anuncia el retiro de su servicio Google Reader

Send to Kindle: envía artículos de la web a tu Kindle

Streamified: Un elegante RSS de social media

Los mejores lectores de Feeds RSS

Conoce al modelo original del Enterprise que estuvo desaparecido por décadas

Eclipse R3dfox: Un fork de Firefox moderno para Windows 7 y 8.x

Windows File Manager: El gestor de archivos de Windows 3.x, ahora en versiones modernas

Ollama: Cómo ejecutar modelos de inteligencia artificial en tu PC

APKUpdater mantiene al día tus aplicaciones Android sin usar tiendas oficiales

Programming Fonts: Un sitio con más de 140 fuentes para programadores

La función de Windows que lleva 30 años sin ser actualizada

Cómo saber el nombre de una película

Cómo leer artículos de pago gratis

Los mejores buscadores de la Deep Web

Lectulandia: Descargar libros gratis sin registrarse

Los mejores lugares para descargar fondos de pantalla con movimiento

«Traductor élfico» en línea: Tengwar y Sindarin a tu alcance