在这篇文章中,我们展示了贝多芬《月光奏鸣曲》(Op. 27 No. 2)的三个乐章与三种不同的机器学习架构之间存在结构对应关系,而非单纯的类比。通过对乐谱的计算分析,包括熵、Jensen-Shannon散度、不和谐度、手部分布重叠、自相似矩阵、时间记忆衰减和上下文音高嵌入等,我们得出了四个反直觉的发现:
- 感知的音乐“温度”由通量决定,而非分布宽度;
- 最轻的乐章却具有最高的不和谐度;
- 这些乐章实现了流媒体、递归和周期性位置编码的记忆架构;
- 相同的音高类别在不同乐章中获得不同的上下文身份,这类似于自然语言处理中上下文与静态嵌入的关系——无监督聚类能够在没有音乐理论输入的情况下恢复音调结构。
我们构建了一个反向声化,将分析特征解码回MIDI,并量化了编码-解码周期的手性:哪些分布能够保持而顺序则会破坏。通过听众的观察,解码后的作品听起来像是“无法重叠的镜像异构体”,手性测量揭示了重构损失随着n-gram顺序单调增加。Bootstrap基线和子样本检查证实所有乐章都携带高于噪声的顺序信息,尽管原始值受样本大小的影响。跨领域比较显示,自然语言的手性高于音乐,反映了更强的顺序约束。
博主点评: 这篇文章通过独特的跨领域视角探讨了音乐与机器学习的关系,展示了计算分析如何揭示音乐作品的深层结构。尤其是对手性及其在音频与语言中的应用的探讨,提供了新的思考路径,值得深入研究。