This question already has answers here:
Pandas conditional creation of a series/dataframe column
(8个答案)
去年关闭。
我有以下DataFrame(这是一个精简版本-可以回溯很长时间)
我想创建一个新列,该列指定基于特定时间段的标签。 IE:如果行在某个日期之前,则返回一个单词。
我尝试了以下方法:
我收到以下错误:“ AttributeError:'DatetimeIndex'对象没有属性'apply'”。
我已将其更改为字符串,尝试重置索引,以便可以将其应用于列而不是索引,并且它不起作用。
我也尝试过这个:
错误:ValueError:具有多个元素的数组的真值不明确。使用a.any()或a.all()
任何关于更好方法的建议也将受到赞赏。
(8个答案)
去年关闭。
我有以下DataFrame(这是一个精简版本-可以回溯很长时间)
Week Commencing A1 A2 A3 A4
2016-01-03 28 1375 1999 1345
2016-01-10 48 1552 2428 1337
2016-01-17 43 1895 2615 1420
2016-01-24 29 1950 2568 1385
2016-01-31 41 1912 2577 1277
2016-02-07 29 2176 2771 1403
2016-02-14 50 2229 3013 1450
2016-02-21 60 2271 3029 1489
2016-02-28 43 2140 3133 1594
2016-03-06 51 2080 3140 1498
我想创建一个新列,该列指定基于特定时间段的标签。 IE:如果行在某个日期之前,则返回一个单词。
我尝试了以下方法:
def action(x):
if x == "True":
return "Before Migration"
if x == "False":
return "After Migration"
df.index.apply(action, axis=1)
我收到以下错误:“ AttributeError:'DatetimeIndex'对象没有属性'apply'”。
我已将其更改为字符串,尝试重置索引,以便可以将其应用于列而不是索引,并且它不起作用。
我也尝试过这个:
if df.index < '2016-02-14':
df["Migration_Type"] = "Before Migration"
else:
df["Migration_Type"] = "After Migration"
错误:ValueError:具有多个元素的数组的真值不明确。使用a.any()或a.all()
任何关于更好方法的建议也将受到赞赏。
最佳答案
尝试这样的事情:
# First, initialize a new column, set it to before migration by default
df = df.assign(Migration_Type = "Before Migration")
# Then, assign "after migration" to all rows after your chosen date
df.loc[df.index >= '2016-02-14', 'Migration_Type'] = "After Migration"
关于python - 带For循环的Python定义函数,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/48918606/
10-13 03:33