我有10,000个数据集。这些数据来自UCI机器学习存储库普查收入。
无论如何,关键是我想将字符串数据更改为data。我想运行朴素的贝叶斯分类,但是我需要使用数字。
基本上:
State-gov = 1
Self-emp-not-inc = 2
Private = 3
数据框:
age workclass fnlwgt ... hours-per-week native-country income
0 39 State-gov 77516 ... 40 United-States <=50K
1 50 Self-emp-not-inc 83311 ... 13 United-States <=50K
2 38 Private 215646 ... 40 United-States <=50K
3 53 Private 234721 ... 40 United-States <=50K
4 28 Private 338409 ... 40 Cuba <=50K
注意:这些只是10,000个数据中的5个。
最佳答案
告诉我是否可以找到想要的东西here
(1)astype(int)方法:
df['DataFrame Column'] = df['DataFrame Column'].astype(int)
(2)to_numeric方法:
df['DataFrame Column'] = pd.to_numeric(df['DataFrame Column'])
范例:
import pandas as pd
Data = {'Product': ['AAA','BBB'],
'Price': ['210','250']}
df = pd.DataFrame(Data)
print (df)
print (df.dtypes)
也许您需要用Dataframe.replace替换那些字符串
关于python - 如何将数据框中的字符串数据更改为数字?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/60028069/