我有一个较大的事务数据框,我想根据某个列(“类型”)分成两个较小的数据框。如果“类型”为“S”,则将整个行添加到“cust_sell”数据帧,如果“类型”为“P”,则添加到“cust_buy”数据帧。我正在使用for循环,但这只是将索引值添加到数据框。任何帮助表示赞赏!
from win32com.shell import shell, shellcon
import pandas as pd
filename = (shell.SHGetFolderPath(0, shellcon.CSIDL_PERSONAL, None, 0)) + '\MSRB T-1_test.xlsx'
wb = pd.read_excel(filename, sheet_name='T1-20062017', index_col=0, header=0)
cust_buy = []
cust_sell = []
# Create a list of customer buys and sells separately
for i in wb.index:
if wb['Type'][i] == 'S':
cust_sell.append([i])
elif wb['Type'][i] == 'P':
cust_buy.append([i])
最佳答案
您不需要编写循环。您可以使用 Pandas 轻松做到这一点。
假设您的数据框如下所示:
import pandas as pd
mainDf = pd.DataFrame()
mainDf['Type'] = ['S', 'S', 'S', 'P', 'P', 'S', 'P', 'S']
mainDf['Dummy'] = [1, 2, 3, 4, 5, 6, 7, 8]
要为S和P类型创建数据框,只需执行以下操作:
cust_sell = mainDf[mainDf.Type == 'S']
cust_buy = mainDf[mainDf.Type == 'P']
cust_sell输出:
Type Dummy
0 S 1
1 S 2
2 S 3
5 S 6
7 S 8
cust_buy输出:
Type Dummy
3 P 4
4 P 5
6 P 7
关于python - 根据具有特定值的行创建一个新的数据框,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/51004029/