Design and implementation of piano audio automatic music transcription algorithm based on convolutional neural network

Guardado en:

Detalles Bibliográficos
Publicado en:	EURASIP Journal on Audio, Speech, and Music Processing vol. 2025, no. 1 (Dec 2025), p. 26
Autor principal:	Li, Mengshan
Publicado:	Springer Nature B.V.
Materias:	Piano Musical instruments Sound filters Machine learning Music Automatic classification Signal processing Wavelet transforms Artificial intelligence Adaptability Fourier transforms Artificial neural networks Optimization Neural networks Frequency ranges Frequencies Algorithms Information processing Audio signals Audio data Pianos Information retrieval Parameter estimation
Acceso en línea:	Citation/Abstract Full Text Full Text - PDF
Etiquetas:	Agregar Etiqueta Sin Etiquetas, Sea el primero en etiquetar este registro!

Descripción
Resumen:	This paper presents the design and implementation of an automatic music transcription algorithm for piano audio, utilizing an optimized convolutional neural network with optimal parameters. In this study, we adopt the cepstral coefficient derived from cochlear filters, a method commonly used in speech signal processing, for extracting features from transformed musical audio. Conventional convolutional neural networks often rely on a universally shared convolutional kernel when processing piano audio, but this approach fails to account for the variations in information across different frequency bands. To address this, we select 24 Mel filters, each featuring a distinct center frequency ranging from 105 to 19,093 Hz, which aligns with the 44,100 Hz sampling rate of the converted music. This setup enables the system to effectively capture the key characteristics of piano audio signals across a wide frequency range, providing a solid frequency-domain foundation for the subsequent music transcription algorithms.
ISSN:	1687-4714 1687-4722
DOI:	10.1186/s13636-025-00412-7
Fuente:	Advanced Technologies & Aerospace Database