我有10,000个数据集。这些数据来自UCI机器学习存储库普查收入。

无论如何,关键是我想将字符串数据更改为data。我想运行朴素的贝叶斯分类,但是我需要使用数字。

基本上:

State-gov = 1
Self-emp-not-inc = 2
Private = 3


数据框:

          age          workclass   fnlwgt  ...  hours-per-week   native-country  income
    0      39          State-gov    77516  ...              40    United-States   <=50K
    1      50   Self-emp-not-inc    83311  ...              13    United-States   <=50K
    2      38            Private   215646  ...              40    United-States   <=50K
    3      53            Private   234721  ...              40    United-States   <=50K
    4      28            Private   338409  ...              40             Cuba   <=50K


注意:这些只是10,000个数据中的5个。

最佳答案

告诉我是否可以找到想要的东西here

(1)astype(int)方法:

df['DataFrame Column'] = df['DataFrame Column'].astype(int)


(2)to_numeric方法:

df['DataFrame Column'] = pd.to_numeric(df['DataFrame Column'])


范例:

import pandas as pd

Data = {'Product': ['AAA','BBB'],
          'Price': ['210','250']}

df = pd.DataFrame(Data)
print (df)
print (df.dtypes)


也许您需要用Dataframe.replace替换那些字符串

关于python - 如何将数据框中的字符串数据更改为数字?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/60028069/

10-12 16:07
查看更多