您是否知道Azure Machine Learning Studio中的哪个模块允许添加新列?我不是指来自不同数据集的``复制粘贴''列,而是基于给定逻辑的新列,例如IF语句?我想一种方法就是执行自定义R / Python脚本,但是有专门的模块吗?
最佳答案
您可以通过熊猫的Execute Python Script
操作使用模块DataFrame
:
import pandas as pd
# The entry point function can contain up to two input arguments:
# Param<dataframe1>: a pandas.DataFrame
# Param<dataframe2>: a pandas.DataFrame
def azureml_main(dataframe1 = None, dataframe2 = None):
# Execution logic goes here
print('Input pandas.DataFrame #1:\r\n\r\n{0}'.format(dataframe1))
dataframe1['new_column'] = dataframe1.apply(lambda row: extractValue(row), axis=1)
# Return value must be of a sequence of pandas.DataFrame
return dataframe1,
def extractValue(row):
return 1 if row['column1'] == 'something else 2
您还可以使用
Execute Python Script
创建具有新列的新数据集,并使用Add Columns
模块进行合并。关于azure - Azure ML Studio-添加新列,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/43202780/