我想在sklearn包中,找到一类路径上每个特征的基尼系数
例如虹膜数据中。如鸢尾花花瓣长度基尼:0.4,花瓣宽度基尼:0.4。

最佳答案

您可以使用Python + numpy计算基尼系数,如下所示:

from typing import List
from itertools import combinations

import numpy as np

def gini(x: List[float]) -> float:
    x = np.array(x, dtype=np.float32)
    n = len(x)
    diffs = sum(abs(i - j) for i, j in combinations(x, r=2))
    return diffs / (2 * n**2 * x.mean())

08-04 00:30