pd.NA vs np.nan表示熊猫。与熊猫一起使用哪一个,为什么要使用?每个大熊猫的主要利弊是什么?

一些同时使用它们的示例代码:

import pandas as pd
import numpy as np

df = pd.DataFrame({ 'object': ['a', 'b', 'c',pd.NA],
                   'numeric': [1, 2, np.nan , 4],
                    'categorical': pd.Categorical(['d', np.nan,'f', 'g'])
                 })


输出:

|    | object   |   numeric | categorical   |
|---:|:---------|----------:|:--------------|
|  0 | a        |         1 | d             |
|  1 | b        |         2 | nan           |
|  2 | c        |       nan | f             |
|  3 | <NA>     |         4 | g             |

最佳答案

pd.NA在最新版本的pandas-1.0.0中引入。

我建议在np.nan上使用它,因为它包含在pandas库中,因此最好与DataFrames一起使用。

07-24 09:52
查看更多