熊猫有内置的多目标排序算法吗?

我发现this是NSGA-II算法(这是我想要的),但是它需要将目标函数作为单独的文件传递。在理想情况下,我将对所有数据使用DataFrame,在指定目标函数列(以及其他必需参数)的同时调用类似multi_of_sort的方法,它将返回另一个具有Pareto最佳值的DataFrame。

这似乎对熊猫来说是微不足道的,但我可能是错的。

最佳答案

事实证明,上面引用的pareto包确实可以处理DataFrame输入。

import pareto
import pandas as pd

# load the data
df = pd.read_csv('data.csv')

# define the objective function column indices
# optional. default is ALL columns
of_cols = [4, 5]

# define the convergence tolerance for the OF's
# optional. default is 1e-9
eps_tols = [1, 2]

# sort
nondominated = pareto.eps_sort([list(df.itertuples(False))], of_cols, eps_tols)

# convert multi-dimension array to DataFrame
df_pareto = pd.DataFrame.from_records(nondominated, columns=list(df.columns.values))

09-06 01:47