Recuperación de información musical - Music information retrieval
La recuperación de información musical ( MIR ) es la ciencia interdisciplinaria de recuperar información de la música . MIR es un campo de investigación pequeño pero en crecimiento con muchas aplicaciones del mundo real. Los involucrados en MIR pueden tener experiencia en musicología , psicoacústica , psicología , estudios académicos de música, procesamiento de señales , informática , aprendizaje automático , reconocimiento óptico de música, inteligencia computacional o alguna combinación de estos.
Aplicaciones
MIR está siendo utilizado por empresas y académicos para categorizar, manipular e incluso crear música.
Clasificación musical
Uno de los temas de investigación clásicos de MIR es la clasificación de géneros, que consiste en clasificar elementos musicales en uno de los géneros predefinidos, como clásica, jazz, rock, etc. La clasificación del estado de ánimo, la clasificación de artistas y el etiquetado de música también son temas populares.
Sistemas de recomendación
Ya existen varios sistemas de recomendación de música, pero sorprendentemente pocos se basan en técnicas MIR, sino que hacen uso de la similitud entre usuarios o de una laboriosa compilación de datos. Pandora , por ejemplo, usa expertos para etiquetar la música con cualidades particulares como "cantante femenina" o "línea de bajo fuerte". Muchos otros sistemas encuentran usuarios cuyo historial de escucha es similar y sugiere música no escuchada a los usuarios de sus respectivas colecciones. Las técnicas MIR para la similitud en la música están comenzando a formar parte de tales sistemas.
Separación de fuentes de música y reconocimiento de instrumentos
La separación de fuentes de música consiste en separar las señales originales de una mezcla de señales de audio. El reconocimiento de instrumentos consiste en identificar los instrumentos involucrados en la música. Se han desarrollado varios sistemas MIR que pueden separar la música en sus pistas componentes sin acceso a la copia maestra. De esta manera, por ejemplo, se pueden crear pistas de karaoke a partir de pistas de música normales, aunque el proceso aún no es perfecto debido a que las voces ocupan parte del mismo espacio de frecuencia que los otros instrumentos.
Transcripción automática de música
La transcripción automática de música es el proceso de convertir una grabación de audio en notación simbólica, como una partitura o un archivo MIDI . Este proceso implica varias tareas de análisis de audio, que pueden incluir detección de tonos múltiples, detección de inicio , estimación de duración, identificación de instrumentos y extracción de información armónica, rítmica o melódica. Esta tarea se vuelve más difícil con un mayor número de instrumentos y un mayor nivel de polifonía .
Generación musical
La generación automática de música es un objetivo de muchos investigadores del MIR. Se han realizado intentos con éxito limitado en términos de apreciación humana de los resultados.
Métodos utilizados
Fuente de datos
Las partituras dan una descripción clara y lógica de la música desde la que trabajar, pero el acceso a partituras, ya sean digitales o de otro tipo, a menudo no es práctico. La música MIDI también se ha utilizado por razones similares, pero algunos datos se pierden en la conversión a MIDI desde cualquier otro formato, a menos que la música se haya escrito teniendo en cuenta los estándares MIDI, lo cual es poco común. Los formatos de audio digital como WAV , mp3 y ogg se utilizan cuando el audio en sí es parte del análisis. Los formatos con pérdida, como mp3 y ogg, funcionan bien con el oído humano, pero pueden faltar datos cruciales para el estudio. Además, algunas codificaciones crean artefactos que podrían ser engañosos para cualquier analizador automático. A pesar de esto, la ubicuidad del mp3 ha significado que mucha investigación en el campo los involucre como material fuente. Cada vez más, los metadatos extraídos de la web se incorporan en MIR para una comprensión más completa de la música dentro de su contexto cultural, y esto recientemente consiste en el análisis de etiquetas sociales para la música.
Representación de características
El análisis a menudo puede requerir algunos resúmenes, y para la música (como con muchas otras formas de datos) esto se logra mediante la extracción de características , especialmente cuando se analiza el contenido de audio y se aplica el aprendizaje automático. El propósito es reducir la gran cantidad de datos a un conjunto de valores manejable para que el aprendizaje se pueda realizar dentro de un marco de tiempo razonable. Una característica común extraída es el coeficiente cepstral de frecuencia mel (MFCC), que es una medida del timbre de una pieza musical. Se pueden emplear otras características para representar la clave , los acordes, las armonías, la melodía , el tono principal , los tiempos por minuto o el ritmo de la pieza. Hay una serie de herramientas de extracción de funciones de audio disponibles. Disponible aquí
Estadísticas y aprendizaje automático
- Métodos computacionales para clasificación, agrupamiento y modelado: extracción de características musicales para música mono y polifónica , similitud y coincidencia de patrones , recuperación
- Métodos formales y bases de datos: aplicaciones de identificación y reconocimiento automático de música , como seguimiento de partituras , acompañamiento automático, enrutamiento y filtrado para consultas de música y música, lenguajes de consulta, estándares y otros metadatos o protocolos para el manejo y recuperación de información musical , sistemas de múltiples agentes. , búsqueda distribuida)
- Software para la recuperación de información musical: Web semántica y objetos digitales musicales, agentes inteligentes, software colaborativo, búsqueda basada en web y recuperación semántica , consulta por tarareo / búsqueda por sonido , huellas dactilares acústicas
- Análisis de música y representación del conocimiento: resumen automático, citas, extractos, degradación, transformación, modelos formales de música, partituras y representaciones digitales, indexación de música y metadatos .
Otros asuntos
- Interacción e interfaces persona-computadora: interfaces multimodales, interfaces de usuario y usabilidad , aplicaciones móviles, comportamiento del usuario
- Percepción musical, cognición, afecto y emociones: métricas de similitud musical , parámetros sintácticos, parámetros semánticos, formas musicales, estructuras, estilos y metodologías de anotación musical.
- Archivos de música, bibliotecas y colecciones digitales: bibliotecas digitales de música , acceso público a archivos musicales, puntos de referencia y bases de datos de investigación.
- Derechos de propiedad intelectual y música: cuestiones de derechos de autor nacionales e internacionales , gestión de derechos digitales , identificación y trazabilidad
- Sociología y economía de la música: industria de la música y uso de MIR en la producción, distribución, cadena de consumo, elaboración de perfiles de usuarios, validación, necesidades y expectativas de los usuarios, evaluación de sistemas de IR de música, creación de colecciones de pruebas, diseño experimental y métricas
Actividad académica
- La conferencia de la Sociedad Internacional para la Recuperación de Información Musical (ISMIR) es el lugar de primer nivel para la investigación de recuperación de información musical.
- La Conferencia Internacional sobre Acústica, Habla y Procesamiento de Señales (ICASSP) también es un lugar de gran relevancia.
Ver también
- Motor de búsqueda de audio
- Minería de audio
- Gestión de derechos digitales
- Procesamiento de señales digitales
- Etnomusicología
- Lista de software de música
- Recuperación de información multimedia
- Reconocimiento automático de contenido
- Notación musical
- Musicología
- Reconocimiento óptico de música
- Código de Parsons
- Computación de sonido y música
Referencias
- Michael Fingerhut (2004). "Recuperación de información musical, o cómo buscar (y tal vez encontrar) música y eliminar los incipits" , Congreso IAML-IASA , Oslo (Noruega), 8 al 13 de agosto de 2004.
enlaces externos
- Sociedad Internacional para la Recuperación de Información Musical
- Investigación de recuperación de información musical
- J. Stephen Downie: recuperación de información musical
- M. Schedl, E. Gómez y J. Urbano: Recuperación de información musical: desarrollos y aplicaciones recientes
- Nicola Orio: Recuperación de música: tutorial y revisión
- Sistemas de audio inteligentes: fundamentos y aplicaciones de la recuperación de información musical, curso introductorio en el Centro de investigación informática en música y acústica de la Universidad de Stanford
- Micheline Lesaffre: Recuperación de información musical: marco conceptual, anotación y comportamiento del usuario.
- The Echo Nest: una empresa especializada en investigación y aplicaciones MIR.
- Imagine Research: desarrolla plataforma y software para aplicaciones MIR
- AudioContentAnalysis.org: recursos MIR y código matlab