如果您请求使用Sound In Xml 数据集
研究人员需要同意以下条款和条件:

  1. 研究人员应仅将数据库用于非商业研究和教育目的。
  2. 上海市音乐声学艺术重点实验室不对数据库做任何陈述或保证,包括但不限于不侵权或适合特定目的的保证。
  3. 研究人员对使用数据库承担全部责任,并应对上海市音乐声学艺术重点实验室,包括其雇员,受托人,管理人员和代理人,对由研究人员使用数据库引起的任何和所有索赔进行辩护并作出赔偿。 ,包括但不限于研究人员使用他或她可能从数据库中创建的受版权保护的图像的任何副本。
  4. 如果研究人员和同事首先同意接受这些条款和条件的约束,则研究人员可以为他们提供访问数据库的权限。
  5. 上海市音乐声学艺术重点实验室保留随时终止研究人员对数据库的访问的权利。
  6. 如果Researcher受营利性商业实体雇用,则Researcher的雇主也应受这些条款和条件的约束,并且Researcher特此声明,他或她已被完全授权代表该雇主签订本协议。
  7. 中国法律适用于本协议下的所有争议。

Sound In Xml 的特点

一直以来,音乐人工智能的数据集制作领域,主要是使用Midi格式、Music Xml格式或者各个研究机构各自开发的格式。但这几种方式都有各自的问题。

Midi格式使用的历史比较悠久,能够方便的在各种音乐制作编辑软件中打开,方便制作,也能直接听到音响,但是我们不能方便直接在Midi文件中加入各种标注信息,往往只能用另一个配套文件来共同使用,使用不便。此外,作为二进制文件,我们也无法直接从Midi文件中直观的看到音乐中音符、起始位置等信息。

Music Xml格式是基于乐谱的格式,广泛应用于各种乐谱制作领域,方便制作,有各种丰富的标记,能直接以文本方式打开,并能直观的看到音乐的相关信息。但是,Music Xml的目标是表征乐谱的,里面包含大量再音乐数据标注不需要的乐谱布局信息,此外在乐谱软件上直接做标注也相对不方便。

为此,很多研究机构分别采用自研的数据格式来满足音乐人工智能的需求,多种标准下就很难产生相当数量的数据,也缺乏相关的编辑工具,不利于大规模研究的展开。

为解决上述问题,我们提出Sound In Xml 格式,结合Midi与Music Xml的优点,并联合多个高校研究机构,人工智能研发企业,软件开发厂商等共同围绕该标准制作数据形成数据集,并开发配套编辑工具。此外,我们也正在联合更多的音乐领域的研究资源的加入,希望能不断升级该标准,从而促进各种研究的进步。

数据标准说明

文件头

本标准采用可扩展标记语言的的方式。头文件采用标准xml的格式:<?xml version="1.0" encoding="utf-8"?>

本标准中时间单位均为节拍数

音乐

样例:<Music creationTime="3 Nov 2021 9:12:49"modifiedBy="MyName" lastModifiedTime="9 Dec 2021 9:56:58" title="NewProject2"></Music>

根元素 Music 音乐
属性 creationTime 文件创建时间值类型 string
属性 modifiedBy 文件修改人值类型 string
属性 lastModifiedTime 最近一次文件修改时间值类型 string
属性 title 文件标题值类型 string

速度轨道

样例:  <TempoTrack>    <Tempo startBeat="0.0" bpm="120.0"/>    <TimeSig startBeat="0.0" sigBeat="3" sigBeatsType="4"/>  </TempoSequence>

根元素 TempoTrack 速度轨道
根元素 Tempo 速度属性 startBeat 速度改变的起始节拍时间点值类型 float
属性 bpm 速度值值类型 int

根元素 TimeSig 拍号
属性 startBeat 拍号改变的节拍时间点值类型 float
属性 sigBeat 每小节的节拍数值类型 int
属性 sigBeatsType 以几分音符为一拍值类型 int

标记轨道

样例:  <MarkerTrack id="1015" name="&#26631;&#35760;">    <MarkerBlock name="&#26631;&#35760; 1" length="2.0" id="1008" startBeat="0.0"/>    <MarkerBlock name="&#26631;&#35760; 2" length="2.0" id="1014" startBeat="8.0"/>  </MarkerTrack>

根元素 MarkerTrack 标记轨
属性 id id号值类型 int 属性 name 名称值类型 string
根元素 MarkerBlock 标记块
属性 name 标记块名称值类型 string
属性 length 标记块持续时间值类型 float
属性 id 标记块编号值类型 int
属性 startBeat 开始的节拍值类型 float

和声轨道说明

样例:  <ChordTrack name="&#26609;&#24335;&#21644;&#24358;&#36827;&#34892;" id="1069">  </ChordTrack>
根元素 ChordTrack 和声轨
属性 name 和声轨道名称值类型 string
属性 id 和声轨道编号值类型 int

轨道/Midi块

样例:  <MidiTrack id="1020" name="&#38050;&#29748;">    <MidiBlock name="&#26032;&#30340;MIDI&#29255;&#27573;" length="3.573333333333333" id="1023" startBeat="4.0"></MidiBlock></MidiTrack>
根元素 Track 音符轨
属性 id 音符轨名称值类型 int
根元素 MidiBlock Midi块
属性 Name Midi块名称值类型 string
属性 length 音符块持续长度值类型 float
属性 id 音符块编号值类型 int
属性 startBeat 音符块起始时间值类型 float

音符

样例:<Note pitch="62" beat="0.0" length="1.0" velocity="100"/>
根元素 Note 音符
属性 Pitch 音高值类型 int
属性 beat 音符起始节拍值类型 float
属性 length 音符持续拍数值类型 float
属性 velocity 音符力度值类型 int

音频块

样例:<AudioTrack id="1037">    <AudioBlock name="&#38899;&#39057;&#36712;&#36947; 2 &#24405;&#38899; 1"                length="3.659138321995465" id="1031" source="comp_&#38899;&#39057;&#36712;&#36947; 2_Take_1.wav"                startBeat="0.0"/>  </AudioTrack>
根元素 AudioTrack 音频块轨id id号
根元素 AudioBlock 音频块
属性 name 音频块名称值类型 string
属性 length 音频块持续长度值类型 float
id id号值类型 int
属性 source 音频路径来源值类型 string
属性 startBeat 音频起始节拍值类型 float