我有一个wav文件,其中包含录制的chi声。

频率采样44100
通道数1
完整样本N 90405
秒2.05
chi声只有50ms。

chi的图像:
[https://i.imgur.com/Hr4u5tx.jpg][1]

到目前为止,我已经阅读了wav文件并执行了一些基本处理的代码。

fs_rate, signal = wavfile.read("chirp.wav")
print ("Frequency sampling", fs_rate)
l_audio = len(signal.shape)
print ("Channels", l_audio)
if l_audio == 2:
    signal = signal.sum(axis=1) / 2
N = signal.shape[0]
print ("Complete Samplings N", N)
secs = N / float(fs_rate)
print ("secs", secs)
Ts = 1.0/fs_rate # sampling interval in time
print ("Timestep between samples Ts", Ts)
t = scipy.arange(0, secs, Ts) # time vector as scipy arange field / numpy.ndarray
FFT = abs(scipy.fft(signal))
FFT_side = FFT[range(N//2)] # one side FFT range
freqs = scipy.fftpack.fftfreq(signal.size, t[1]-t[0])
fft_freqs = np.array(freqs)
freqs_side = freqs[range(N//2)] # one side frequency range
fft_freqs_side = np.array(freqs_side)
plt.subplot(311)
p1 = plt.plot(t, signal, "g") # plotting the signal
plt.xlabel('Time')
plt.ylabel('Amplitude')
plt.savefig('chirp.jpg')

问题:
使用python如何知道tell的第一个采样点在音频文件中的位置。
收到the声的第一点。

该信号包含背景噪声。我期望的结果
应该说这是您的线性调频信号以2kHz频率开始的地方。

PS:这不是作业问题。我正在学习DSP。有点自学。

最佳答案

如果您知道线性调频序列,则可以将其与之关联以开始线性调频线性调频。

import scipy.signal as sig
h = sp.array(chirp_sequence)
rxy = sig.correlate(signal, h)
start_idx = arg.max(abs(rxy))

10-06 04:03