in Software

MusicLM: Inteligencia artificial para generar música a partir de texto

Aún no estamos seguros si podemos llamarla «música», pero…

por Lisandro Pardo 31 enero, 2023, 6:56 pm

A mediados de diciembre hablamos sobre Riffusion, una variante de Stable Diffusion que nos permite crear música con inteligencia artificial, a partir de un simple texto. El tiempo está a favor de los algoritmos, y con cada nuevo proyecto obtenemos resultados más precisos. Hoy es el turno de Google Research, que acaba de presentar a MusicLM. Además de crear audio en 24 KHz, este modelo soporta condiciones especiales como la generación de melodías largas, y un «modo historia» para preparar secuencias.

La explosión viral de ChatGPT provocó un «código rojo» en Google. El gigante de Mountain View utiliza inteligencia artificial en varios niveles, pero todo parece indicar que se aproxima una ola de nuevos proyectos como respuesta directa al chatbot de OpenAI. Dicho de otra forma, Google necesita enseñar al público sus cartas un poco más, y una de ellas es MusicLM. Este trabajo de Google Research nos propone algo muy interesante: Generar música con inteligencia artificial, usando una simple descripción.

MusicLM: ¿Cómo suena la música hecha con inteligencia artificial?

generar música con inteligencia artificial — Así es: MusicLM puede inspirarse en pinturas

La página de demostración no posee un modelo activo de MusicLM, pero está repleta de ejemplos acompañados por sus respectivos prompts. El entrenamiento de MusicLM se basa en «un gran dataset de música sin etiquetas», y en otro dataset llamado MusicCaps, con un total de 5.521 combinaciones de música y texto. Las descripciones de MusicCaps fueron creadas por humanos, y el audio asociado proviene de AudioSet, una colección con más de dos millones de clips de audio (diez segundos de duración), extraídos de YouTube.

«The main soundtrack of an arcade game. It is fast-paced and upbeat, with a catchy electric guitar riff. The music is repetitive and easy to remember, but with unexpected sounds, like cymbal crashes or drum rolls.»

Los resultados de MusicLM están divididos en varias categorías. La primera de ellas es «Rich Captions», con muestras de 30 segundos basadas en una breve descripción. «Long Generation» nos enseña el potencial del modelos para crear canciones completas con una duración de cinco minutos. «Story Mode» convierte a las descripciones en secuencias con intervalos definidos, «Text and Melody Conditioning» combina el texto del prompt con una melodía de referencia, y «Painting Caption Conditioning» genera audio inspirado en una pintura o imagen.

Story Mode convierte al prompt en una secuencia a seguir

A eso se suma la capacidad de MusicLM para reproducir instrumentos y géneros específicos, niveles de experiencia musical (un pianista novato o un maestro violinista), lugares, épocas, y más. Sin embargo, todo lo que tenemos hasta aquí son sus ejemplos oficiales. Google Research confirmó que «no hay planes» para compartir modelos por ahora, y tienen muchos desafíos por delante (hipotéticos problemas de copyright, sesgo cultural, etc.).

Sitio oficial: Haz clic aquí

Reportar

inteligencia artificial

¿Qué te pareció?

7 Points

Voto Positivo Voto Negativo

Escrito por Lisandro Pardo

Deja una respuesta Cancelar la respuesta

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Calculadoras online: Emulación de calculadoras clásicas

ChatGPT llega al mundo de la radioafición

Populares

Geeky Una monería

in Hardware

Short Stack: La Nintendo Wii más pequeña del mundo

Nada de emulación aquí: Este proyecto usa hardware original

La idea de miniaturizar consolas de videojuegos no es nueva que digamos. Previamente hemos visto dos versiones diferentes de la Nintendo GameCube, y convertir a la Nintendo 64 en portátil es un hack muy popular, pero ahora es el turno de la Nintendo Wii, y es muy probable que este diseño sea el más compacto […] More

por Lisandro Pardo 21 abril, 2024, 5:25 am
Thug life

in Hardware

Cómo crear un ratón open source

¿Cansado de las ofertas comerciales? Tal vez esto ayude

Si sientes que los ratones han perdido calidad en los últimos años, no estás solo. Los interruptores mueren de la noche a la mañana, no hay limpieza que los ayude, y nunca falta un sensor de mala calidad. Alexander Nadeau, también conocido como «wareya» en GitHub y YouTube, explica que ya va por su tercer […] More

por Lisandro Pardo 22 abril, 2024, 5:50 pm
Geeky

in Entretenimiento

Tráiler Flash: Deadpool & Wolverine (nuevo trailer)

Basta de teasers: Aquí está lo bueno

Deadpool & Wolverine es la única película del universo cinemático para todo el año, pero con estos dos en la pantalla… ¿realmente necesitamos más? La sensación de «Time’s Up» para el MCU es más fuerte que nunca, y el giro hacia la calidad que busca Disney necesita materializarse de una vez. Esta es la carta […] More

por Lisandro Pardo 22 abril, 2024, 6:38 pm
Geeky

in Entretenimiento

Conoce al modelo original del Enterprise que estuvo desaparecido por décadas

Apareció en eBay de la nada… y la historia tiene final feliz

Toda franquicia famosa de cine y televisión tiene sus misterios, sus rumores, sus objetos desaparecidos. Star Trek no es la excepción, y si consideramos que la serie original estuvo casi tres años en el aire a finales de los ’60… digamos que hay mucho por descubrir. Una de las novedades más importantes surgió en noviembre […] More

por Lisandro Pardo 23 abril, 2024, 6:12 pm
Thug life Geeky Una monería

in Hardware

Los cartuchos de Super Nintendo, como nunca los has visto

Protecciones, memorias, chips especiales, y más

Los cartuchos de videojuegos pueden ser muy simples, con apenas un chip para almacenar el código y un par de condensadores que filtran ruido. Sin embargo, con el paso del tiempo lograron convertirse en «tarjetas de expansión», sumando memoria adicional y procesadores especiales para garantizar el rendimiento de juegos avanzados. La Super Nintendo es un […] More

por Lisandro Pardo 24 abril, 2024, 5:24 am
Thug life

in Software

Tiny11Builder, nuevo script para crear una versión liviana de Windows 11

No es apto para cardíacos, pero nos alegra saber que existe…

Y en otro episodio de «Microsoft sigue divorciado de la realidad», las últimas noticias indican que hay nueva publicidad en el menú de inicio de Windows 11, cortesía de un hotfix que (por ahora) mantiene un perfil opcional. ¿Qué significa eso? Que una vez más debemos tomar el cuchillo y destripar al sistema operativo, hasta […] More

por Lisandro Pardo 24 abril, 2024, 7:45 pm

La impresora 3D más grande del mundo

Tráiler Flash: Trap

Tu juego gratis del fin de semana: Industria

Mejorar YouTube es más fácil que nunca con Enhancer for YouTube

Thermonator: El perro-robot con lanzallamas que puedes comprar hoy

Tiny11Builder, nuevo script para crear una versión liviana de Windows 11

MusicLM: Inteligencia artificial para generar música a partir de texto

Aún no estamos seguros si podemos llamarla «música», pero…

MusicLM: ¿Cómo suena la música hecha con inteligencia artificial?

¿Qué te pareció?

Escrito por Lisandro Pardo

Deja una respuesta Cancelar la respuesta

Los mejores clientes de correo electrónico gratuitos

Google anuncia el retiro de su servicio Google Reader

Send to Kindle: envía artículos de la web a tu Kindle

Streamified: Un elegante RSS de social media

Los mejores lectores de Feeds RSS

La impresora 3D más grande del mundo

Mejorar YouTube es más fácil que nunca con Enhancer for YouTube

Tiny11Builder, nuevo script para crear una versión liviana de Windows 11

Eclipse R3dfox: Un fork de Firefox moderno para Windows 7 y 8.x

Windows File Manager: El gestor de archivos de Windows 3.x, ahora en versiones modernas

Ollama: Cómo ejecutar modelos de inteligencia artificial en tu PC

APKUpdater mantiene al día tus aplicaciones Android sin usar tiendas oficiales

Cómo saber el nombre de una película

Los mejores buscadores de la Deep Web

Cómo leer artículos de pago gratis

Lectulandia: Descargar libros gratis sin registrarse

Los mejores lugares para descargar fondos de pantalla con movimiento

«Traductor élfico» en línea: Tengwar y Sindarin a tu alcance

Calculadoras online: Emulación de calculadoras clásicas

ChatGPT llega al mundo de la radioafición

Short Stack: La Nintendo Wii más pequeña del mundo

Cómo crear un ratón open source

Tráiler Flash: Deadpool & Wolverine (nuevo trailer)

Conoce al modelo original del Enterprise que estuvo desaparecido por décadas

Los cartuchos de Super Nintendo, como nunca los has visto

Tiny11Builder, nuevo script para crear una versión liviana de Windows 11

MusicLM: ¿Cómo suena la música hecha con inteligencia artificial?

¿Qué te pareció?

Deja una respuesta Cancelar la respuesta

Hemos detectado un bloqueador de publicidad.

Entrar

Sign In

¿Has olvidado la clave?

Your password reset link appears to be invalid or expired.

Entrar

Privacy Policy

Agregar a Colección

No Collections