Python 科学工具笔记
numpy
- a = numpy.array([1,2,3,4]);// 创建一个numpy的数组对象
此时a.shape显示的值为(4,);
由此得出结论在一维的数组中, 数组的是列优先的 - numpy.random.uniform(low, high):
产生在low和high之间的随机数 - numpy.vdot(arrA, arrB):
计算arrA与arrB的数量积 - numpy.max(), .min(), .sum(), .average()
- numpy.random.randn():
Scipy
- scipy.integrate.quad(funcname, low, high): funcname函数的仅仅返回一个需要求解积分的式子
low: 积分下线
high: 积分上限
matplotlib.pyplot
import matplotlib.pyplot as plt
plt.hist()
plt.plot()
plt.pie()
plt.bar()
plt.show()
plt.scatter()
numpy库使用
- genfromtxt(filename, delimiter, dtype, skip_header=1/2)
filename: 文件名
delimiter: 分隔符, 用于分隔文件中每行的内容放入到矩阵中
dtype: 矩阵中的类型, ATTENTION: numpy矩阵中的所有元素是同一个类型
skip_header: 是否跳过首行
- numpy.array(list): 根据list返回一个numpy的矩阵
- obj.shape: 返回维度信息
- obj.dtype: 返回numpy的dtype类型对象, 显示矩阵中的元素类型
- [2], [2:3]: 对以为矩阵, 获取指定的元素
对于二维矩阵元素的获取:
[2:3, 3:4]: 逗号左侧表示对行的切片, 逗号右边表示对列的切片
对numpy中的矩阵进行操作符的操作(<. ==, >)等指的是对矩阵中每一个元素进行该操作, bool类型的操作返回的是bool序列
矩阵中的切片可是一个bool类型的序列, [bool_list], 返回对应的为True的元素组成的序列
obj.astype(dtype): 改变元素的类型
obj.min(),.max(), sum(),其中可以添加默认参数, axis=1|0, 如果为0表示按照列为单位计算min, max等, 返回每一行的min, max等, 如果为axis=1则是以行为单位
numpy.isnan(array): 返回bool序列, 判断元素的空项
obj.arange(0, 100, 2)
obj.linspace(0, 100, 100)
obj.ndim: 返回矩阵的维度
obj.size: 元素个数
obj.zeros(tuple)
obj.ones(tuple)
numpy.random.random((2, 3)): 生成2行3列的元素为随机数的矩阵
obj0.dot(obj1)或者numpy.dot(obj0, obj1): 矩阵乘法, obj0的列向量与obj1的行向量的数量积
numpy.exp(array), numpy.sin(array), numpy.sqrt(array), numpy.floor(array)
obj.ravel(): 解开矩阵, 将矩阵拉成以为向量
numpy.vstack(obj0, obj1): 将obj0与obj1垂直拼接
numpy.hstack(obj0, obj1): 将obj0与obj1水平拼接
numpy.vsplit(obj, 3): 将obj垂直切两刀平均分为3个矩阵
numpy.hsplit(obj, 3): 同理
numpy.vsplit(obj, (2, 3)): 以2行3列的元素所在的列为分隔线分隔为3份
numpy.hsplit(obj, (2, 3)): 同理
numpy.reshape(2, 3): 调整矩阵的行和列
obj.view(): 浅拷贝, 不建议使用
obj.copy(): 深拷贝
obj.tile(2, 3): 也为拷贝, 但是拷贝出来的矩阵的行是原来的2倍, 列是原来的3倍
obj.sort(axis=1|0): 按照行或者列进行判断
pandas库使用(pandas是对numpy的封装, 随意可以混合使用)
- pandas.read_csv(filename): 读取文件返回DataFrame对象(df), 只要数据是以逗号分隔的都可使用read_csv读取
- df.dtypes返回类型
- df.head(3): 查看前3行
- df.tail(3): 查看后3行
- df.columns: 列名
- df.shape: 维度信息, 表格的行和列信息
- df.loc[index]: 返回指定行的信息
- df['string']: 返回指定的名称的列信息, 返回Series, DataFrame就是有很多个Series中组成的
- 在pandas中的python内置的str类型为object类型(dtype中显示的)
- obj.dropna(): 去掉有空项的行
- Series对象
series.index返回index序列
series.sortindex排序index
series.sortvalues排序values
series[0]|series['str']: 返回索引对应的value
matplotlib.pyplot库使用
- 画出折线图