in Software

Riffusion: Una variante de Stable Diffusion para crear música con inteligencia artificial

Y todo comienza con una poco de texto…

por Lisandro Pardo 17 diciembre, 2022, 5:54 am

Los desarrolladores de plataformas generativas se adaptan a nuevas exigencias. Los entusiastas y los artistas «combaten» en redes sociales. Y entre todo ese caos surgen nuevos proyectos basados en inteligencia artificial. Uno de ellos es Riffusion, que utiliza una versión optimizada de Stable Diffusion para crear espectrogramas, representaciones visuales de sonido que podemos escuchar fácilmente.

Imágenes, vídeos, voces, música. Los proyectos de inteligencia artificial siguen evolucionando… con opiniones a favor y en contra. Recientemente hemos visto protestas, muchos «intercambios» que equivalen a ladrillazos digitales, y enormes dudas en materia de copyright y fair use. Tarde o temprano, los conflictos legales llegarán a instancias superiores, pero independientemente de lo que suceda, la inteligencia artificial continuará sorprendiéndonos.

Hoy es el turno de una nueva plataforma generativa llamada Riffusion, desarrollada por Seth Forsgren y Hayk Martiros. Tal y como lo sugiere su nombre, Riffusion tiene alma de Stable Diffusion, con una diferencia: El modelo fue especialmente optimizado para generar sonogramas/espectrogramas. En otras palabras, representaciones visuales de audio basadas en prompts de texto.

Riffusion: De texto a audio con inteligencia artificial

Ingresa un prompt, y deja que el modelo haga el resto

La página no requiere ninguna clase de cuenta, ni la compra de tokens para generar sonidos. De hecho, recomienda al usuario que experimente ingresando sus estilos e instrumentos favoritos. Las combinaciones son definitivamente bienvenidas, por ejemplo, «gospel tropical». También es posible crear prompts que indiquen la presencia de voces (uno de los más interesantes que encontré fue «post-teen pop talent show winner»), pero no debemos esperar ningún diálogo claro.

El sonograma/espectrograma es fácil de interpretar: El eje X representa el tiempo, el eje Y la frecuencia de los sonidos, y el color de cada píxel su amplitud. La última fase queda a cargo de Torchaudio, que toma la imagen generada por Stable Diffusion, y la convierte en audio. La sección About de Riffusion es excelente, y merece tu atención.

Al igual que en otros modelos, puedes alterar el seed y el nivel de denoising

La configuración avanzada nos permite cambiar la imagen que sirve como seed (cinco opciones diferentes), y el nivel de denoising. Cuanto más alto es, más «creativo» resulta su output… pero se alejará de lo que quieres. Este comportamiento es idéntico al de Stable Diffusion procesando imágenes. Otra cosa que toma prestada es el peso de los prompts. Por ejemplo, un énfasis en violines puede ser escrito como (violin:1.25) entre paréntesis, o corchetes para minimizar su impacto: [violin] equivale a una reducción de 1.1x.

Para finalizar, el servidor de Riffusion está siendo bombardeado con solicitudes, por lo tanto, hay que armarse de paciencia. También necesitarás buena aceleración de hardware en tu navegador, porque el sitio oficial es bastante exigente. ¡Haz la prueba!

Sitio oficial: Haz clic aquí

Reportar

Destacados inteligencia artificial

¿Qué te pareció?

8 Points

Voto Positivo Voto Negativo

Escrito por Lisandro Pardo

Deja una respuesta Cancelar la respuesta

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Enlaces Recomendados de la Semana (N°699)

Turtle.Audio: Cómo «dibujar música» imitando al Logo

Populares

Trending Thug life Geeky

in Artilugios

EarlGreyTV: Liberando a tu Smart TV con una sobredosis de Linux

Es literalmente un portátil colgando en la parte de atrás… pero a esto llegamos

Cada vez que visito una tienda de electrodomésticos y veo los últimos modelos de Smart TVs, quedo aterrado por la cantidad de bloatware que viene preinstalado en ellos. El ingeniero de software Carl Riis comparte un sentimiento similar, pero en vez de renunciar al concepto de Smart TV por completo, decidió crear el proyecto EarlGreyTV, […] More

por Lisandro Pardo 23 julio, 2024, 6:36 pm
¡Pero qué c...!

in Software

Microsoft: «Menos del 1 por ciento» de los sistemas con Windows fue afectado por CrowdStrike

Eso nos da mucho que pensar…

El caos parece haber quedado atrás y el mundo informático lentamente comienza a recuperarse… pero es imposible negar que CrowdStrike nos dio una gran sacudida. Su CEO se inmoló en la Web, y otros han pasado el fin de semana calculando pérdidas, sin embargo, hoy tenemos la palabra de Microsoft, que compartió sus propios números: […] More

por Lisandro Pardo 22 julio, 2024, 4:45 pm
Thug life Geeky Una monería ¡Pero qué c...!

in Internet

Joseph Ducreux: El artista detrás del meme

Rompió las reglas, y dos siglos después conquistó la Web

Sí, conoces la imagen. La has visto hasta el cansancio. El texto cambia, pero su postura y su sonrisa son las mismas. ¿Quién es ese sujeto, y cómo se convirtió en un meme global? Lo correcto es comenzar por su nombre: Se llamaba Joseph Ducreux, llegó a ser Primer Pintor de la Reina María Antonieta, […] More

por Lisandro Pardo 21 julio, 2024, 12:09 pm
Trending

in Hardware

Cyberdore 2064: Excelente cyberdeck basado en el Raspberry Pi Zero

Archivos de impresión gratuitos, buena disponibilidad de partes… nada mal

El primer paso siempre es el más difícil, y ni siquiera la fabricación de cyberdecks puede escapar a eso. Previamente hemos explorado diseños fabulosos con hardware Framework, e inspirados en el universo Fallout, pero si alguien desea «mojarse los pies» en las aguas de los cyberdecks, tal vez quiera comenzar con un proyecto más sencillo. […] More

por Lisandro Pardo 25 julio, 2024, 7:46 pm
Geeky

in Software

CrowdStrike: Entendiendo el caos

Algunos lo han llamado «El Y2K que nunca tuvimos»…

Pasaron 24 horas. Muchos departamentos técnicos y de seguridad han cancelado sus vacaciones, y el mundo entero busca recuperarse de lo que probablemente haya sido el «apagón» informático más grande de la historia. También hemos detectado confusión en los reportes, algunos acusando a Microsoft, otros a CrowdStrike, y otros repartiendo golpes para ambas compañías. Veamos… More

por Lisandro Pardo 20 julio, 2024, 2:52 pm
Trending ¡Pero qué c...!

in Negocios

¿Por qué nadie quiere organizar los Juegos Olímpicos?

Dinero, corrupción, mentiras… ¿más dinero?

El próximo viernes comienzan los Juegos Olímpicos de París. Algunos eventos se anticipan a la ceremonia oficial por cuestiones de calendario, pero no hay dudas de que la cobertura mediática será total. Sin embargo, detrás de toda esta celebración del deporte internacional hay una verdad incómoda: El interés por organizar los Juegos se cae a […] More

por Lisandro Pardo 22 julio, 2024, 8:23 pm

Blue Screen Simulator Plus: Simulador de pantallas azules

Restaurando PCs afectados por CrowdStrike… ¿con códigos de barras?

USS Yorktown: El crucero que dividió por cero

Cyberdore 2064: Excelente cyberdeck basado en el Raspberry Pi Zero

Tráiler Flash – Joker: Folie à Deux (nuevo tráiler)

El arsenal nuclear de Estados Unidos: ¿Cuántas armas tiene?

Riffusion: Una variante de Stable Diffusion para crear música con inteligencia artificial

Y todo comienza con una poco de texto…

Riffusion: De texto a audio con inteligencia artificial

¿Qué te pareció?

Escrito por Lisandro Pardo

Deja una respuesta Cancelar la respuesta

Los mejores clientes de correo electrónico gratuitos

Google anuncia el retiro de su servicio Google Reader

Send to Kindle: envía artículos de la web a tu Kindle

Streamified: Un elegante RSS de social media

Los mejores lectores de Feeds RSS

Blue Screen Simulator Plus: Simulador de pantallas azules

Blue Screen Simulator Plus: Simulador de pantallas azules

Restaurando PCs afectados por CrowdStrike… ¿con códigos de barras?

USS Yorktown: El crucero que dividió por cero

Microsoft: «Menos del 1 por ciento» de los sistemas con Windows fue afectado por CrowdStrike

CrowdStrike: Entendiendo el caos

PCSX2: El mejor emulador de PlayStation 2, ahora en su versión 2.0

Los mejores buscadores de la Deep Web

Cómo saber el nombre de una película

Observa la restauración extrema de un ordenador Atari 800XL

Cómo saber a qué anime pertenece una imagen o meme

PCSX2: El mejor emulador de PlayStation 2, ahora en su versión 2.0

Lectulandia: Descargar libros gratis sin registrarse

Enlaces Recomendados de la Semana (N°699)

Turtle.Audio: Cómo «dibujar música» imitando al Logo

EarlGreyTV: Liberando a tu Smart TV con una sobredosis de Linux

Microsoft: «Menos del 1 por ciento» de los sistemas con Windows fue afectado por CrowdStrike

Joseph Ducreux: El artista detrás del meme

Cyberdore 2064: Excelente cyberdeck basado en el Raspberry Pi Zero

CrowdStrike: Entendiendo el caos

¿Por qué nadie quiere organizar los Juegos Olímpicos?

Riffusion: De texto a audio con inteligencia artificial

¿Qué te pareció?

Deja una respuesta Cancelar la respuesta

Hemos detectado un bloqueador de publicidad.

Entrar

Sign In

¿Has olvidado la clave?

Your password reset link appears to be invalid or expired.

Entrar

Privacy Policy

Agregar a Colección

No Collections