基于卷积神经网络的光学音乐识别

光学字符识别 (OCR) 通常用于将扫描文档中的文本转换为计算机上可搜索和可编辑的形式,这是一种成熟的数字化技术。但是,其他种类的、意义丰富的文件,比如音乐手稿呢?国际艺术与技术杂志上的新工作讨论了光学音乐识别 OMR 的可能性。

尼西亚雅加达 Bina Nusantara 大学的一个团队开发了一种新方法,该方法使用深度机器学习和卷积神经网络来识别已知手稿上乐谱的细微差别。然后,该算法可以将新呈现的音乐手稿以 8% 的准确率转换为数字化形式。即使在这个级别,这也大大减少了转换手稿所需的手动输入和更正量。

系统要求谱号、五线谱和音调就位,但这些很容易在模板中分配。扫描手稿的转换然后检测每个音符在五线谱上的位置,从而定义音高。下一步将是使用并行算法来检测每个音符的持续时间,并识别手稿的静音、休止符和其他此类特征的位置。

一旦完全数字化,就目前的软件而言,使用计算机使用各种器乐声音“播放”手稿,甚至将抒情乐谱与音乐相关联并让计算机“唱”这首歌是一件小事。OMR一旦成熟,将在音乐手稿存档、音乐表演和音乐教育方面有许多应用。该团队建议他们的方法可以允许软件“应用程序”开发人员为智能手机或平板电脑编写程序,例如,允许任何人快速扫描乐谱,并对该手稿执行 OMR。

当然,虽然音乐数字化工具可以为广大对音乐感兴趣的人提供支持,但仍然存在音乐天赋的问题。不幸的是,没有应用程序可以做到这一点。

(0)
上一篇 2022年3月28日
下一篇 2022年3月28日

相关推荐