我想检查数据文件中的列是否包含字符串,这样我就可以用数字来标记它们,用于机器学习的目的。有些列由数字组成,我不想更改它们。列示例如下:
TRAIN FEATURES
Age Level
32.0 Silver
61.0 Silver
66.0 Silver
36.0 Gold
20.0 Silver
29.0 Silver
46.0 Silver
27.0 Silver
谢谢=
最佳答案
是的,有可能。你使用dtype
import pandas as pd
import numpy as np
df = pd.DataFrame({'a': ['a','b','c','d']})
if df['a'].dtype != np.number:
print('yes')
else:
print('no')
也可以使用
select_dtypes
按数据类型选择列。df_subset = df.select_dtypes(exclude=[np.number])
# Now apply you can label encode your df_subset
关于python - Python:检查dataframe列是否包含字符串类型,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/43049545/