我正在研究异常值检测。布伦丹·格雷格(Brendan Gregg)的article非常好,他的可视化效果特别吸引我。他使用的方法之一是frequency trails

我正在尝试使用this示例在matplotlib中重现此内容。看起来像这样:

情节就是基于这个答案:https://stackoverflow.com/a/4152016/948369

现在,我的问题是,就像布伦丹(Brendan)所描述的那样,我有一条连续的线掩盖了异常值(我简化了输入值,以便您仍然可以看到它们):

对于将不存在的值设置为“非连续”行有任何帮助吗?

最佳答案

我会坚持使用平坦的2D图,并将每个水平位移固定的垂直量。您必须播放关卡(在下面的代码中,我称为displace)才能正确看到异常值,但这在复制目标图像方面做得很好。我认为,关键是将“零”值设置为None,以便pylab不会绘制它们。

import numpy as np
import pylab as plt
import itertools

k = 20
X = np.linspace(0, 20, 500)
Y = np.zeros((k,X.size))

# Add some fake data
MU = np.random.random(k)
for n in xrange(k):
    Y[n] += np.exp(-(X-MU[n]*n)**2 / (1+n/3))
Y *= 50

# Add some outliers for show
Y += 2*np.random.random(Y.shape)

displace = Y.max()/4

# Add a cutoff
Y[Y<1.0] = None

face_colors = itertools.cycle(["#D3D820", "#C9CC54",
                               "#D7DA66", "#FDFE42"])

fig = plt.figure()
ax = fig.add_subplot(111, axisbg='black')
ax.xaxis.set_visible(False)
ax.yaxis.set_visible(False)

for n,y in enumerate(Y):
    # Vertically displace each plot
    y0 = np.ones(y.shape) * n * displace
    y1 = y + n*displace

    plt.fill_between(X, y0,y1,lw=1,
                     facecolor=face_colors.next(),
                     zorder=len(Y)-n)
plt.show()

09-11 19:53