一直以来,音乐人工智能的数据集制作领域,主要是使用Midi格式、Music Xml格式或者各个研究机构各自开发的格式。但这几种方式都有各自的问题。
Midi格式使用的历史比较悠久,能够方便的在各种音乐制作编辑软件中打开,方便制作,也能直接听到音响,但是我们不能方便直接在Midi文件中加入各种标注信息,往往只能用另一个配套文件来共同使用,使用不便。此外,作为二进制文件,我们也无法直接从Midi文件中直观的看到音乐中音符、起始位置等信息。
Music Xml格式是基于乐谱的格式,广泛应用于各种乐谱制作领域,方便制作,有各种丰富的标记,能直接以文本方式打开,并能直观的看到音乐的相关信息。但是,Music Xml的目标是表征乐谱的,里面包含大量再音乐数据标注不需要的乐谱布局信息,此外在乐谱软件上直接做标注也相对不方便。
为此,很多研究机构分别采用自研的数据格式来满足音乐人工智能的需求,多种标准下就很难产生相当数量的数据,也缺乏相关的编辑工具,不利于大规模研究的展开。
为解决上述问题,我们提出Sound In Xml 格式,结合Midi与Music Xml的优点,并联合多个高校研究机构,人工智能研发企业,软件开发厂商等共同围绕该标准制作数据形成数据集,并开发配套编辑工具。此外,我们也正在联合更多的音乐领域的研究资源的加入,希望能不断升级该标准,从而促进各种研究的进步。