in

Million Song Dataset: Una enorme base de datos musical

El problema que hoy enfrentan los diferentes tipos de servicios de música en línea no está en ofrecer al usuario el tema que quiere. Después de todo, sólo se debe limitar a buscar el contenido y reproducirlo. En realidad, el truco está en saber qué música es la que le gusta al usuario, y ofrecerle sugerencias para incrementar la experiencia. Los ordenadores pueden haber mejorado mucho a la hora de interpretar la semántica de un lenguaje, pero en el caso de la música, todavía tienen mucho para aprender. Allí es en donde entra esta gigantesca base de datos, liberada al público general.

La realización de sugerencias en el entorno comercial puede encontrarse en casi todas partes. “¿Te puedo ofrecer un postre para acompañar a tu combo?” es una pregunta relativamente común entre las casas de comida rápida más importantes del globo, y el ejemplo se repite de forma constante en muchos otros rubros. Los ordenadores no son la excepción, y los servicios en línea tampoco. La música a través de Internet se está convirtiendo en un negocio particularmente redituable. Los usuarios de Grooveshark siguen creciendo, Spotify llegó al millón de usuarios que pagan una suscripción mensual, y de ninguna forma podemos ignorar la masiva cantidad de canciones vendidas por iTunes. Entonces, ¿cómo seguir? La solución no es otra más que detectar y comprender los gustos del consumidor. El servicio Pandora recurre a musicólogos para expandir su base de datos y realizar sugerencias, pero ahora, surge otra opción.

Million Song Dataset es una gigantesca base de información que contiene datos sobre un millón de canciones, pero irónicamente, no hay audio en su interior. Dicha información puede ser utilizada por investigadores y desarrolladores para crear y mejorar algoritmos destinados a recomendar música, a realizar estudios culturales, y otros tantos proyectos. Su tamaño responde directamente a una necesidad comercial. Cualquier desarrollador puede tener un algoritmo eficiente, pero no sirve de nada si sólo logra sugerir veinte o treinta canciones por vez. Con la cantidad de usuarios conectados que puede tener un servicio de música en línea en un tiempo determinado, la necesidad de sugerencias se ve elevada a varios cientos de miles de canciones, como mínimo.

Lo más importante de todo esto es que Million Song Dataset está disponible para todos los interesados, sin costo alguno. Quienes deseen darle un vistazo pueden descargar una pequeña porción con algunos miles de temas, pero aquellos que se encuentren de lleno en el desarrollo de una aplicación para entregar y recomendar música en línea, tal vez deban realizar el titánico esfuerzo de bajar la base completa. Nada fácil a decir verdad, ya que el tamaño total del Million Song Dataset puede exceder los 280 GB. Por último, volvemos a repetir: Esto no tiene audio en su interior. No encontrarás mp3s ni discografías completas. El Million Song Dataset puede que tenga un rol crítico para las aplicaciones de música del futuro, pero en cuanto a acumular música se refiere, eso sigue siendo trabajo tuyo.

Reportar

¿Qué te pareció?

Escrito por Lisandro Pardo

5 Comments

Leave a Reply
  1. …yo descargue unos archivos de ahi pero me salieron en formato .h5 y no lo pude abrir descargue el hdf5 …y tampoco con q programa se abre esos archivos ?

    • estos archivos son solamente manejables mediante aplicaciones destinadas para ello, de hecho, realizo un proyecto fin de carrera relacionado con el tema, puede usar por ejemplo weka, pero te aseguro que si no tienes idea del tema… no entenderás nada, yo aun estoy perdido

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Facebook implementa un sistema para evitar suicidios

Mortal Kombat – The Kombat Kontinues (Vídeo)