您是否知道Azure Machine Learning Studio中的哪个模块允许添加新列?我不是指来自不同数据集的``复制粘贴''列,而是基于给定逻辑的新列,例如IF语句?我想一种方法就是执行自定义R / Python脚本,但是有专门的模块吗?

最佳答案

您可以通过熊猫的Execute Python Script操作使用模块DataFrame

import pandas as pd

# The entry point function can contain up to two input arguments:
#   Param<dataframe1>: a pandas.DataFrame
#   Param<dataframe2>: a pandas.DataFrame
def azureml_main(dataframe1 = None, dataframe2 = None):

    # Execution logic goes here
    print('Input pandas.DataFrame #1:\r\n\r\n{0}'.format(dataframe1))


    dataframe1['new_column'] = dataframe1.apply(lambda row: extractValue(row), axis=1)

    # Return value must be of a sequence of pandas.DataFrame
    return dataframe1,


def extractValue(row):
    return 1 if row['column1'] == 'something else 2


您还可以使用Execute Python Script创建具有新列的新数据集,并使用Add Columns模块进行合并。

关于azure - Azure ML Studio-添加新列,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/43202780/

10-10 22:37