我有一个pandas.DataFramewordvecs_df,列按顺序标记为'word''count''v1''v50''norm1''norm50'。我想创建一个新的pandas df,其中只有'word''count'norm1-norm50的列。

wordvecs_df.loc[:,"norm1":"norm50"]

获取我norm1 -ccc>,但是如果我尝试输入单词和计数,我会得到一个索引错误:索引太多。
我不知道如何从数据框中取出我想要的列。有什么想法吗?

最佳答案

您可以建立列名列表,例如:

columns = ['word', 'count'] + ['norm%d' % i for i in range(1, 51)]
wordvecs_df.loc[:,columns]

10-06 00:55