我有多个列数据框,其中包含 ['Country', 'Energy Supply', 'Energy Supply per Capita', '% Renewable'] 列。
在能源供应列中,我想将列的单位从 Giga 转换为 Peta。但是在这个过程中energy['Energy Supply']*= energy['Energy Supply']
,当值类似于“....”(缺失值由此表示)时,也会成倍增加或重复。此外,列中的字符串值也会成倍增加。 (例如原件:Peta,手术后:PetaPetaPetaPeta...)。
为了阻止这种情况发生,我正在运行:
energy = pd.read_excel("Energy Indicators.xls",skiprows = 16, skip_footer = 38)
energy.drop(['Unnamed: 0','Unnamed: 1'],axis = 1, inplace = True)
energy.columns = ['Country', 'Energy Supply', 'Energy Supply per Capita', '% Renewable']
for i in energy['Energy Supply']:
if (isinstance(energy[i],int) == True):
energy['Energy Supply'][i]=energy['Energy Supply'][i]*1000000
return (energy)
但是我没有得到结果,即仅更改整数类型变量的值,并且没有任何变化。
我认为问题出在哪里,前两行将给出 false 条件,因为第一行是“字符串”,基于此,程序没有修改值,而我想单独检查值是否为整数类型,如果是,则将数字乘以 1,000,000。
输入:
Country Energy Supply Energy Supply per Capita % Renewable
0 NaN Petajoules Gigajoules %
1 Afghanistan 321 10 78.6693
2 Albania 102 35 100
3 Algeria 1959 51 0.55101
4 American Samoa ... ... 0.641026
预期输出:
Country Energy Supply Energy Supply per Capita % Renewable
0 NaN Petajoules Gigajoules %
1 Afghanistan 3210000 10 78.6693
2 Albania 1020000 35 100
3 Algeria 19590000 51 0.55101
4 American Samoa ... ... 0.641026
电流输出:
Country Energy Supply Energy Supply per Capita % Renewable
0 NaN PetajoulesPeta. Gigajoules %
1 Afghanistan 3210000 10 78.6693
2 Albania 1020000 35 100
3 Algeria 19590000 51 0.55101
4 American Samoa ........ ... 0.641026
最佳答案
您可以使用 str.isnumeric
来检查字符串是否为数字,然后相乘。
energy['Energy Supply'] = energy['Energy Supply'].apply(lambda x: int(x) * 1000000 if str(x).isnumeric() else x)
print (energy)
Country Energy Supply Energy Supply per Capita % Renewable
0 NaN Petajoules Gigajoules %
1 Afghanistan 321000000 10 78.6693
2 Albania 102000000 35 100
3 Algeria 1959000000 51 0.55101
4 American Samoa ... .. 0.641026
关于python - 如何迭代多列数据框中的每个单独的列值?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/52913191/