我有多个列数据框,其中包含 ['Country', 'Energy Supply', 'Energy Supply per Capita', '% Renewable'] 列。

在能源供应列中,我想将列的单位从 Giga 转换为 Peta。但是在这个过程中energy['Energy Supply']*= energy['Energy Supply'] ,当值类似于“....”(缺失值由此表示)时,也会成倍增加或重复。此外,列中的字符串值也会成倍增加。 (例如原件:Peta,手术后:PetaPetaPetaPeta...)。

为了阻止这种情况发生,我正在运行:

energy = pd.read_excel("Energy Indicators.xls",skiprows = 16, skip_footer = 38)
energy.drop(['Unnamed: 0','Unnamed: 1'],axis = 1, inplace = True)
energy.columns = ['Country', 'Energy Supply', 'Energy Supply per Capita', '% Renewable']
for i in energy['Energy Supply']:
    if (isinstance(energy[i],int) == True):
        energy['Energy Supply'][i]=energy['Energy Supply'][i]*1000000
return (energy)

但是我没有得到结果,即仅更改整数类型变量的值,并且没有任何变化。

我认为问题出在哪里,前两行将给出 false 条件,因为第一行是“字符串”,基于此,程序没有修改值,而我想单独检查值是否为整数类型,如果是,则将数字乘以 1,000,000。

输入:
    Country        Energy Supply    Energy Supply per Capita    % Renewable
0   NaN             Petajoules            Gigajoules                 %
1   Afghanistan        321                   10                  78.6693
2   Albania            102                   35                    100
3   Algeria            1959                  51                  0.55101
4   American Samoa      ...                 ...                  0.641026

预期输出:
    Country        Energy Supply    Energy Supply per Capita    % Renewable
0   NaN             Petajoules            Gigajoules                 %
1   Afghanistan        3210000                10                     78.6693
2   Albania            1020000                35                      100
3   Algeria            19590000               51                     0.55101
4   American Samoa      ...                 ...                    0.641026

电流输出:
    Country        Energy Supply    Energy Supply per Capita    % Renewable
0   NaN             PetajoulesPeta.         Gigajoules               %
1   Afghanistan        3210000                10                   78.6693
2   Albania            1020000                35                    100
3   Algeria            19590000               51                   0.55101
4   American Samoa      ........                ...                0.641026

最佳答案

您可以使用 str.isnumeric 来检查字符串是否为数字,然后相乘。

energy['Energy Supply'] = energy['Energy Supply'].apply(lambda x: int(x) * 1000000 if str(x).isnumeric() else x)

print (energy)

    Country         Energy Supply   Energy Supply per Capita    % Renewable
0             NaN    Petajoules           Gigajoules                     %
1     Afghanistan    321000000                10                   78.6693
2         Albania    102000000                35                       100
3         Algeria    1959000000               51                   0.55101
4  American Samoa        ...                  ..                  0.641026

关于python - 如何迭代多列数据框中的每个单独的列值?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/52913191/

10-15 23:01