我试图建立一个指数移动平均算法,产生与熊猫ewm()
函数相同的输出。特别是,我正在尝试实施这种方法:
下面的代码可以正常工作,直到移动平均值窗口开始超出初始数据集,此时我开始得到与pandas计算不同的结果。
我已经看了好几个小时了,现在很困惑。有谁能告诉我,我是如何错误地实现上述公式的?
import numpy as np
import pandas as pd
class MovingAverages(object):
def __init__(self, **kwargs):
self.measures = []
self.lookback_period = 5
ema_multiplier = 2 / (self.lookback_period + 1)
self.lookback_alphas = []
for i in range(1,self.lookback_period+1):
self.lookback_alphas.append((1 - ema_multiplier ) ** i)
def insert_bar(self):
self.measures.insert(0, 0)
def on_calculate(self, c):
index = min(len(c), self.lookback_period+1)
y = c[0]
for i in range(1,index):
y += self.lookback_alphas[i-1] * c[i]
y /= 1 + sum(self.lookback_alphas[0:index-1])
self.measures[0] = y
if __name__ == "__main__":
data = [5.00,7.00,4.00,3.00,4.00,
5.00,6.00,7.00,9.00,13.00,
15.00,14.00,14.00,12.00,
11.00,10.00,9.00,8.00,
8.00,8.00,10.00,11.00,
13.00,16.00,18.00,20.00]
# Manually calculate exponential MA and write into list
ma_online = MovingAverages()
series = []
for d in data:
series.insert(0, d)
ma_online.insert_bar()
ma_online.on_calculate(series)
# Calculate a reference exponential MA using Pandas
df = pd.DataFrame({'close': data})
ma_pd = list(df.close.ewm(span=ma_online.lookback_period, adjust=True, ignore_na=True).mean())
# Compare the two lists
ma_online.measures.reverse()
for i in range(len(data)):
assert round(ma_pd[i], 2) == round(ma_online.measures[i], 2)
最佳答案
我不熟悉Python或Panda,但是根据我对文档的理解,当您在span
中使用df.close.ewm(span=ma_online,...)
时,您只需在公式中定义衰减(系数),而不是滑动窗口的大小默认情况下,似乎没有固定的侧窗。
从another documentation of DataFrame.ewm:
量程:浮子,可选
指定量程衰减,α=2/(量程+1),对于量程≥1
以及:
另见:
rolling:提供滚动窗口计算rolling
方法可能是您需要的。
关于python - 根据Pandas ewm()计算指数移动平均值,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/50457141/