我想检查数据文件中的列是否包含字符串,这样我就可以用数字来标记它们,用于机器学习的目的。有些列由数字组成,我不想更改它们。列示例如下:

TRAIN FEATURES
  Age              Level
  32.0              Silver
  61.0              Silver
  66.0              Silver
  36.0              Gold
  20.0              Silver
  29.0              Silver
  46.0              Silver
  27.0              Silver

谢谢=

最佳答案

是的,有可能。你使用dtype

import pandas as pd
import numpy as np

df = pd.DataFrame({'a': ['a','b','c','d']})
if df['a'].dtype != np.number:
    print('yes')
else:
    print('no')

也可以使用select_dtypes按数据类型选择列。
df_subset = df.select_dtypes(exclude=[np.number])
# Now apply you can label encode your df_subset

关于python - Python:检查dataframe列是否包含字符串类型,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/43049545/

10-10 11:24