我在Python中创建了一个简单的动态时间规整实现,但是感觉有点不合常规。我实现了递归关系(或者,至少,我相信我做到了!),但是因为在我的情况下,这涉及到一个numpy数组,所以我不得不将其包装在一个类中以使备忘录起作用(numpy数组是可变的)。

指向DTW的Wiki链接:Dynamic Time Warping

这是代码:

class DynamicTimeWarp(object):
  def __init__(self, seq1, seq2):
    self.warp_matrix = self.time_warp_matrix(seq1, seq2)

  def time_warp_matrix(self, seq1, seq2):
    output = np.zeros((len(seq1), len(seq2)), dtype=np.float64)
    for i in range(len(seq1)):
      for j in range(len(seq2)):
        output[i][j] = np.sqrt((seq1[i] - seq2[j]) ** 2)
    return output·

  @lru_cache(maxsize=100)
  def warp_path(self, i=None, j=None):
    if (i is None) and (j is None):
      i, j = self.warp_matrix.shape
      i   -= 1
      j   -= 1

    distance = self.warp_matrix[i, j]
    path = ((i, j),)
    if i == j == 0:
      return distance, path

    potential = []

    if i - 1 >= 0:
      potential.append(self.warp_path(i-1, j))

    if j - 1 >= 0:
      potential.append(self.warp_path(i, j-1))

    if (j - 1 >= 0) and (i - 1 >=0):
      potential.append(self.warp_path(i-1, j-1))

    if len(potential) > 0:
      new_dist, new_path = min(potential, key = lambda x: x[0])
      distance          += new_dist
      path               = new_path + path

    return distance, path


我的问题:


我相信这是DTW的有效实现吗?
有没有更好的方法来做到这一点,同时保持使用numpy数组
和复发关系?
如果最终不得不使用一个类,然后希望重用该类的实例(通过向其传递新序列,并重新计算warp_matrix),则必须将某种虚拟值作为参数传递给warp_path功能-否则我想lru_cache将错误地返回值。解决这个问题是否有更优雅的方法?

最佳答案

虽然很容易将DTW视为递归函数,但可以实现迭代版本。迭代版本通常快10到30倍。

伊蒙

08-25 05:21