哪种API或框架用于为音乐音符分配值?像Shazzam这样的应用程序如何从麦克风中获取音符并知道如何处理呢?
对我来说,手机麦克风令人惊叹,一些精巧的逻辑可以与音乐商店的调谐器竞争!
编辑1。
有趣的论文。
Shazzam音乐识别应用程序的软件
靠在
Acoustic fingerprinting和Fast Fourier Transform的原理
这是practice中一些类似代码的示例
最佳答案
声学指纹算法不会尝试分析音乐。也就是说,它们不会将音频从麦克风转换为音符。他们正在从音频中提取一些任意特征,这些特征从音乐理论的角度来看并没有多大意义,但对于识别音乐仍然很有用。
通常,您从频谱图开始。频谱图是对频率随时间变化的分析。几乎所有声学指纹识别算法都常见这种情况。他们对频谱图的处理方式以及从中提取的特征有何不同。有些算法正在寻找频谱图中的峰值,有些则将其分成规则的间隔。最终目标通常是生成一堆可以索引并快速搜索的哈希。
Avery Li-Chun Wang最初的Shazam算法是公开可用的。您可以找到详细信息here。