pyplot.scatter允许将与组相对应的数组传递给c=,然后该数组将根据这些组为点着色。但是,这似乎不支持在不单独绘制每个组的情况下生成图例。

因此,例如,可以通过遍历各组并分别绘制每个图来生成带有彩色组的散点图:

import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
feats = load_iris()['data']
target = load_iris()['target']

f, ax = plt.subplots(1)
for i in np.unique(target):
    mask = target == i
    plt.scatter(feats[mask, 0], feats[mask, 1], label=i)
ax.legend()

会产生:

python - 图例按组着色的散点图,无需多次调用plt.scatter-LMLPHP

我可以在不遍历每个组的情况下实现相似的外观:
f, ax = plt.subplots(1)
ax.scatter(feats[:, 0], feats[:, 1], c=np.array(['C0', 'C1', 'C2'])[target])

但是我无法找到第二种策略来生成相应图例的方法。我遇到的所有示例都在各个组之间进行迭代,这似乎不理想。我知道我可以手动生成图例,但这又显得太麻烦了。

最佳答案

解决此问题的matplotlib分散示例也使用了循环,因此可能是预期的用法:https://matplotlib.org/examples/lines_bars_and_markers/scatter_with_legend.html

如果您的更大目标是使分类数据的绘制和标记更直接,则应考虑使用Seaborn。这是与Scatter plots in Pandas/Pyplot: How to plot by category类似的问题

实现目标的一种方法是使用带有标记列的 Pandas 。在Pandas数据框中保存数据后,就可以使用Seaborn pairplot进行这种绘制。 (Seaborn的虹膜数据集也可以作为标记的DataFrame使用)

import seaborn as sns
iris = sns.load_dataset("iris")
sns.pairplot(iris, hue="species")

python - 图例按组着色的散点图,无需多次调用plt.scatter-LMLPHP

如果只需要前两个功能,则可以使用
sns.pairplot(x_vars=['sepal_length'], y_vars=['sepal_width'], data=iris, hue="species", size=5)

python - 图例按组着色的散点图,无需多次调用plt.scatter-LMLPHP

如果您确实想使用sklearn数据字典,则可以将其拉入数据框,如下所示:
import pandas as pd
from sklearn.datasets import load_iris
import numpy as np

feats = load_iris()['data'].astype('O')
target = load_iris()['target']
feat_names = load_iris()['feature_names']
target_names = load_iris()['target_names'].astype('O')

sk_df = pd.DataFrame(
    np.hstack([feats,target_names[target][:,np.newaxis]]),
    columns=feat_names+['target',])
sns.pairplot(sk_df, vars=feat_names, hue="target")

关于python - 图例按组着色的散点图,无需多次调用plt.scatter,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/43967663/

10-15 14:45