机器学习入门-混淆矩阵-准确度-召回率-F1score 1.itertools.product 2. confusion_matrix(test_y, pred_y)

1. itertools.product 进行数据的多种组合

intertools.product(range(0, 1), range(0, 1)) 组合的情况[0, 0], [0, 1], [1, 0], [1, 1]

2. confusion_matrix(test_y, pred_y) # 构造混淆矩阵

混淆矩阵是TP（正的预测成正的）， FP（正的预测成负的）， TN（负的预测成负的）， FN（负的预测成正的）

机器学习入门-混淆矩阵-准确度-召回率-F1score 1.itertools.product 2. confusion_matrix(test_y, pred_y)-LMLPHP

从混淆矩阵中，我们可以很清楚的看出这个信息，这是一个信用欺诈的案例， 134表示的是将欺诈的预测出来的数值， 13表示的是将欺诈的预测成正常的， 131表示的是将正常的预测成正常的，18表示将正常的预测成欺诈的

精度： (134 + 131) / (134+131+13+18)

召回率： (134) / (134 + 13)

F1得分： (1 / (精度 + 召回率))

代码：使用的是一个下采样的欺诈数据的代码，使用confusion_matrix 获得混合矩阵，然后使用plt.imshow() 进行画图操作

best_c = printing_KFold_score(under_train_x, under_train_y)

import itertools

# 画出混淆矩阵, 导入confusion_matrix

def plot_matrix(conf, classes,

                title='confusion matrix', cmap=plt.cm.Blues):

    # 展示直方图

    plt.imshow(conf, cmap=cmap)

    # 图片标题

    plt.title(title)

    # 图片颜色条

    plt.colorbar()

    # 设置x轴和y轴位置

    x_index = np.array(classes)

    # 第一个参数是位置，第二个参数是标签名

    plt.xticks(x_index, classes, rotation=0)

    plt.yticks(x_index, classes)

    conf_mean = conf.max() / 2

    # itertools.product

    # [0, 1] & [0, 1]

    # [0, 0], [0, 1], [1, 0], [1, 1]

    # 将数字添加到混合矩阵中

    for i, j in itertools.product(range(conf.shape[0]), range(conf.shape[1])):

        plt.text(j, i, conf[i, j], horizontalalignment='center',

                 color='white'if conf[i, j] > conf_mean else 'black')

    # 画出的图更加的紧凑

    plt.tight_layout()

from sklearn.metrics import confusion_matrix

# 建立逻辑回归模型

lr = LogisticRegression(C=best_c, penalty='l1')

# 模型训练

lr.fit(under_train_x, under_train_y)

# 模型预测

pred_y = lr.predict(under_text_x)

# 获得混合矩阵

conf = confusion_matrix(under_test_y, pred_y)

# 画图

plot_matrix(conf, classes=[0, 1])

# accrurracy

# 精度

accurracy = (conf[0, 0] + conf[1, 1]) / (conf[0, 0] + conf[0, 1] + conf[1, 0] + conf[1, 1])

# 召回率

recall = conf[1, 1] / (conf[1, 0] + conf[1, 1])

# F1得分

F1_score =  1 / (accurracy + recall)

plt.show()