我正计划制作一个AI歌曲 Composer ,它将一台乐器的一堆歌曲收录进来,从声波中提取音符(如ABCDEFG)和某些功能,进行瓶坯机器学习(最有可能通过递归神经网络),然后输出一系列ABCDEFG音符(也可以生成自己的歌曲/音乐)。

我认为这将是一个无监督的学习问题,但我不确定。

我认为我会使用递归神经网络,但是我对如何解决这个问题有一些疑问:
-我应该从声波中提取什么特征以使输出的音乐悦耳动听?

另外,我还有其他一些问题
-是否可以通过递归神经网络输出带序列音符的 vector (ABCDEF)?
-有什么聪明的方法可以输入声波的特征以及音符序列?

最佳答案

好吧,我曾经做过类似的事情(在Matlab上创建一个类似shazam的应用程序),我认为您可以使用FFT(快速傅立叶变换)将其分解为组成频率及其对应的幅度。然后可以使用不同仪器的频率范围从整体中选择它们并分类。

08-24 22:02