我正在研究异常值检测。布伦丹·格雷格(Brendan Gregg)的article非常好,他的可视化效果特别吸引我。他使用的方法之一是frequency trails。
我正在尝试使用this示例在matplotlib中重现此内容。看起来像这样:
情节就是基于这个答案:https://stackoverflow.com/a/4152016/948369
现在,我的问题是,就像布伦丹(Brendan)所描述的那样,我有一条连续的线掩盖了异常值(我简化了输入值,以便您仍然可以看到它们):
对于将不存在的值设置为“非连续”行有任何帮助吗?
最佳答案
我会坚持使用平坦的2D图,并将每个水平位移固定的垂直量。您必须播放关卡(在下面的代码中,我称为displace
)才能正确看到异常值,但这在复制目标图像方面做得很好。我认为,关键是将“零”值设置为None
,以便pylab不会绘制它们。
import numpy as np
import pylab as plt
import itertools
k = 20
X = np.linspace(0, 20, 500)
Y = np.zeros((k,X.size))
# Add some fake data
MU = np.random.random(k)
for n in xrange(k):
Y[n] += np.exp(-(X-MU[n]*n)**2 / (1+n/3))
Y *= 50
# Add some outliers for show
Y += 2*np.random.random(Y.shape)
displace = Y.max()/4
# Add a cutoff
Y[Y<1.0] = None
face_colors = itertools.cycle(["#D3D820", "#C9CC54",
"#D7DA66", "#FDFE42"])
fig = plt.figure()
ax = fig.add_subplot(111, axisbg='black')
ax.xaxis.set_visible(False)
ax.yaxis.set_visible(False)
for n,y in enumerate(Y):
# Vertically displace each plot
y0 = np.ones(y.shape) * n * displace
y1 = y + n*displace
plt.fill_between(X, y0,y1,lw=1,
facecolor=face_colors.next(),
zorder=len(Y)-n)
plt.show()