最近在学习python,所以了解了一下Pandas,Pandas是基于NumPy的一个开源Python库,它被广泛用于快速分析数据,以及数据清洗和准备等工作。

首先是安装numpy以及pandas,

pip install numpy

pip install pandas

1.首先学习的是pandas的一维数组Series,Seriess可以为数据自定义标签(索引),然后通过索引来访问数组中的数据。

创建 一个一位数组,my_series = pd.Serise(data,index) 。这里的的 data 参数可以是任意数据对象,比如字典、列表,NumPy 数组等。而index 参数则是对 data 的索引值,类似字典的 key。

 import pandas as pd
import numpy as np
commodity = ['gun','pen','apple','book']
price = [1000,200,300,500]
pd.Series(price,commodity)

这样一个简单的series 就创建成了。

数据分析-pandas基础入门(一)-LMLPHP

如果没有索引参数的话,就会自动形成默认的索引,像这样

数据分析-pandas基础入门(一)-LMLPHP

要访问series中的数据,类似于访问字典

 import pandas as pd
import numpy as np
commodity = ['gun','pen','apple','book']
price = [1000,200,300,500]
series1=pd.Series(price,commodity)

数据分析-pandas基础入门(一)-LMLPHP

05-11 22:45