in

La siguiente fase: Generación de vídeo con inteligencia artificial y texto

Un nuevo «teaser» nos dejó de cabeza, ¿pero podrá cumplir con las expectativas?

Generación de vídeo

Es cuestión de tiempo, todos lo sabemos. La generación de vídeo con inteligencia artificial se encuentra en un estado básico, casi primitivo… pero lo mismo se decía sobre la generación de imágenes un año atrás, y hoy no podemos dejar de usar sus algoritmos. Recientemente, la compañía Runway compartió un teaser a través de YouTube y Twitter, anticipando el potencial de su herramienta Text to Video. La demo se ve muy bien… ¿pero qué podemos esperar en la vida real?


La generación de imágenes con inteligencia artificial puede dar lugar a enormes diferencias dependiendo del algoritmo utilizado, pero en líneas generales todos funcionan del mismo modo: Primero describimos qué es lo que queremos (un retrato, un paisaje, etc.), y luego añadimos elementos secundarios que sirven de influencia o fuente de inspiración, como el nombre de un artista, un género específico, un estilo de pintura, y hasta el nombre de una cámara de fotos.

Ahora, imaginemos eso al momento de crear vídeo. Entramos al editor y le pedimos una ciudad con mucho tráfico. Después solicitamos un taxi incrustado contra un semáforo, y finalmente la razón del choque: Un dinosaurio gigante que pasa corriendo. Por supuesto, un experto en edición de vídeo puede hacer eso hoy con el presupuesto adecuado, pero la gente de Runway sugiere que cualquier usuario podría obtener resultados similares en el futuro a través de su nueva herramienta, Text to Video:


Runway Text to Video: Creando vídeos con inteligencia artificial y texto


La calle de una ciudad, un filtro cinemático, un poste de luz que desaparece por arte de magia. Un hermoso jardín, múltiples imágenes, inyección dinámica de texto. Un personaje «verde», un fondo borroso en tiempo real, y un toque de Robert Capa como condimento. El teaser es corto pero promete mucho, y también nos ayuda a definir la visión de Runway. En vez de entrenar a un algoritmo independiente de libre acceso, la compañía parece apuntar al desarrollo de un editor más avanzado con la función integrada de texto a vídeo.

Si quieres ser parte del early access, lo único que debes hacer es visitar la página oficial y llenar un formulario. Sin embargo, todo esto instala una pregunta: ¿Cómo van a entrenar semejante modelo? En la actualidad no hay nada similar a LAION-5B para el vídeo, y el nivel de procesamiento requerido es inmenso. Estaremos esperando…


Fuentes: Runway, Ars Technica


Reportar

¿Qué te pareció?

Escrito por Lisandro Pardo

Deja una respuesta

Tu dirección de correo electrónico no será publicada.

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

MelGeek Pixel

MelGeek Pixel: El primer teclado compatible con piezas Lego