Development of a complete Optical Music Recognition workflow

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/116666
Información del item - Informació de l'item - Item information
Título: Development of a complete Optical Music Recognition workflow
Autor/es: Ríos-Vila, Antonio
Director de la investigación: Calvo-Zaragoza, Jorge | Iñesta, José M.
Centro, Departamento o Servicio: Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos
Palabras clave: Optical Music Recognition | Agnostic Transcription | Machine Translation
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: 20-jul-2021
Fecha de lectura: 21-jun-2021
Resumen: Optical Music Recognition, conocido como OMR, es un área de conocimiento que investiga la lectura computacional de los documentos musicales a partir de su imagen. A pesar de todos sus esfuerzos en conseguir procesos para avanzar en el reconocimiento de las partituras musicales, este campo de investigación tiene varios problemas para la puesta en práctica de los resultados que obtiene. Una de las razones es el poco tratamiento que le ha dado la comunidad científica, por motivos de gestión de prioridades, a un paso fundamental del proceso: la codificación, referida en la literatura como encoding. Este paso en concreto consiste en convertir la salida de un proceso de reconocimiento gráfico, la cual está codificada en un lenguaje agnóstico (donde únicamente se representan facetas gráficas como la posición y la forma que tiene la nota en el pentagrama) a una codificación semántica estándar, la cual representa la partitura tal y como se entendería la música en sí (mediante un lenguaje que representa los roles sintácticos y semánticos de cada nota en el pentagrama). Es necesario obtener esta representación para garantizar la exportabilidad de los resultados producidos para procesarlos en otros programas de procesado digital de la música. En este Trabajo Final de Máster, trabajaremos este aspecto para, finalmente, producir un sistema completo de reconocimiento de música basado en dos pasos: una transcripción agnóstica de la imagen de un pentagrama de entrada y un paso de traducción automática entre la salida de dicho reconocimiento (la cual está en dicha codificación agnóstica) a una codificación semántica. En primer lugar, investigaremos más acerca de cómo enfocar el problema de la traducción automática entre lenguajes musicales, ya que es algo en lo que aún no se ha profundizado en literatura existente. Propondremos diversos sistemas, desde los estadísticos a los basados en redes neuronales profundas, para afrontar el problema y evaluaremos su rendimiento en distintos conjuntos de datos. Una vez realizado este paso, evaluaremos la factibilidad de estos sistemas y propondremos las distintas situaciones en las que un traductor automático entre dos codificaciones musicales pueden ser convenientes. Después de esta investigación, llevaremos a la práctica los resultados obtenidos y crearemos el sistema completo de reconocimiento musical. En esta parte del trabajo, comentaremos cómo se realiza el reconocimiento gráfico de un pentagrama musical y explicaremos tanto los sistemas propuestos que usan traducción automática como el caso base, donde crearemos un sistema que no necesita traducción automática para producir una codificación semántica de la partitura reconocida (aunque tiene peores resultados que si se hace este reconocimiento mediante codificación agnóstica). Finalmente, concluiremos comentando que, tal y como planteamos como hipótesis en este trabajo, existen ventajas en el uso de sistemas completos de OMR basados en traducción automática, al igual que indicaremos las situaciones en las que este tipo de sistemas pueden ser útiles para la comunidad dedicada al procesamiento, la creación y la digitalización de corpus musicales.
URI: http://hdl.handle.net/10045/116666
Idioma: eng
Tipo: info:eu-repo/semantics/masterThesis
Derechos: Licencia Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0
Aparece en las colecciones:Máster Universitario en Ciencia de Datos - Trabajos Fin de Máster

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailTFM_Antonio-Rios-Vila.pdf6,97 MBAdobe PDFAbrir Vista previa


Este ítem está licenciado bajo Licencia Creative Commons Creative Commons