numpy(Numerical Python)提供了python对多维数组对象的支持:ndarray,具有矢量运算能力,快速、节省空间。numpy支持高级大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。

一、一维数组

import numpy as np #导入numpy模块

# 一维数组的表现形式

= np.array([1, 2, 3, 4]) #创建一维数组---------------[1 2 3 4]

np.ndim(a) #显示a的维数--------------1

np.shape(a) #显示a的形状-------------(4,)

a.dtype #显示数据类型---------------dtype('int32')

a.astype(float) #将数据类型转化为浮点型----------------array([1., 2., 3., 4.])

a.astype(str) #将数据类型转化为字符串------array(['1', '2', '3', '4'], dtype='<U11')

a[0] #通过索引显示其中的元素-------1

a[0:3] #通过切片的形式显示想要的元素------[1 2 3]

np.min(a) #找出最小的值,也可以用 a.min()------1

np.max(a) #找出最大的值,也可以用a.max()------4

np.sum(a) #总和的值,也可以用a.sum()------1

a == 2 #得到bool类型------array([False, True, False, False])

a[(a == 2)] #也可以将a == 2的结果为索引,显示其元素值

a.size #显示一维数组的个数------4

a.reshape(2, 2) #将一维数组转化为2*2的矩阵,也可以用a.reshape(2, -1)其中-1表示总的个数除以2的结果------array([[1, 2], [3, 4]])
 

二、二维数组

import numpy as np #导入numpy模块

#二位数组的表现形式

= np.array([[0.1, 0.3, 0.5], [0.2, 0.4, 0.6]])

np.ndim(b) #显示b的维数--------------2

np.shape(b) #显示b的形状-------------(2, 3)

b.dtype #显示数据类型---------------dtype('float64')

np.min(b) #找出最小值,也可以用 b.min()------0.1

np.max(b) #找出最大值,也可以用b.max()------0.6

np.sum(b) #总和,也可以用b.sum()------2.1

b.sum(axis = 0) #列相加------array([0.3, 0.7, 1.1])

b.sum(axis = 1) #行相加------array([0.9, 1.2])

b[:, 1] #显示第二列-------------array([0.3, 0.4])

b[:, 0:2] #显示第一列和第二列 ---------[[0.1 0.3] [0.2 0.4]]

b[1, :] #显示第二行------array([0.2, 0.4, 0.6])

b[:, 1] == 0.4 #得到bool类型------array([False, True])

b[b[:, 1] == 0.4, :] #显示第二例等于0.4的那一行的值------array([[0.2, 0.4, 0.6]])

b.size #显示这个矩阵的个数------6

b.T #转置,将行列互换------array([[0.1, 0.2], [0.3, 0.4], [0.5, 0.6]])

三、 数学运算

import numpy as np #导入numpy模块

数学运算的表现形式

a = np.array([10, 20, 30])
b = np.arange(3) c = a - b #------[10 19 28] c-1 #------array([ 9, 18, 27]) a**2 #------array([100, 400, 900], dtype=int32) a = np.arange(4).reshape(2, 2) #------[[0 1] [2 3]] b = np.array([[2, 3], [4, 5]]) #------[[2 3] [4 5]] a*b #点乘------array([[ 0, 3], [ 8, 15]]) np.dot(a, b) #矩阵乘以矩阵------array([[ 4, 5], [16, 21]]) a.dot(b) #跟上面一样,表现形式不同------array([[ 4, 5], [16, 21]])

四、拼接与剪切

import numpy as np #导入numpy模块
#矩阵的拼接与切割 #拼接
a = np.arange(4).reshape(2, 2) #------[[0 1] [2 3]] b = np.array([[2, 3], [4, 5]]) #------[[2 3] [4 5]] np.hstack((a, b)) #横着拼接------array([[0, 1, 2, 3], [2, 3, 4, 5]]) np.vstack((a, b)) #纵着拼接------array([[0, 1], [2, 3], [2, 3], [4, 5]] #切割
a = np.floor(10*np.random.random((2, 6))) #------[[2. 1. 6. 0. 9. 2.], [6. 5. 7. 6. 9. 5.]] np.hsplit(a, 3) #竖着切,切割成3份------[array([[2., 1.], [6., 5.]]), array([[6., 0.], [7., 6.]]), array([[9., 2.], [9., 5.]])] np.hsplit(a, (1, 5)) #竖着切,从第一列与第五列切割成三等份------[array([[2.], [6.]]), array([[1., 6., 0., 9.], [5., 7., 6., 9.]]), array([[2.], [5.]])] b = a.T #------[[5. 6.], [5. 4.], [0. 5.], [7. 9.], [9. 7.], [2. 6.]] np.vsplit(b, 3) #横着切,切割成3份------[array([[5., 6.], [5., 4.]]), array([[0., 5.], [7., 9.]]), array([[9., 7.], [2., 6.]])]
np.vsplit(b, (2, 5)) #横着切,从第2行与第五行切割成三等份------[array([[5., 6.], [5., 4.]]), array([[0., 5.], [7., 9.], [9., 7.]]), array([[2., 6.]])]

五、深浅copy

import numpy as np

a = np.arange(10)

b = a #这个意思是a和b共指向同一个内存地址。

print(a is b) #------True

print(id(a)) #------4572661200

print(id(b)) #------4572661200

#改变a看b是否也发生变化

a = np.array([1, 2, 3]) #相当于重新指向新的内存地址,b并没有发生改变。

print(b) #并没有随着a一起变化------[0 1 2 3 4 5 6 7 8 9]

#浅cpoy

a = np.floor(10*np.random.random((2, 2))) #------[[7. 9.], [5. 7.]]

b = a.view() #对上面的2*2的矩阵,重新生成一个内存地址,赋予b。

print(b) #------[[7. 9.], [5. 7.]]

b[0, 0] = 10 #改变b的某一个元素,看a是否发生改变。

print(a) #同样随着b一起改变------[[10.  9.], [ 5.  7.]]

print(a is b) #------False

print(id(a)) #------4590772016

print(id(b)) #------4574099216

#深copy

c = a.copy() #不仅重新生成内存地址,包括数据也重新复制

print(c) #------[[10.  9.], [ 5.  7.]]

c[0, 0] = 20 #改变c的某一个元素,看a是否发生改变。

print(a) #a并没有随着c一起变化------[[10.  9.], [ 5.  7.]]

六、获取矩阵每列的最大值

import numpy as np

a = np.sin(np.arange(20)).reshape(4, 5) #产生4*5的矩阵

print(a)
'''
[[ 0. 0.84147098 0.90929743 0.14112001 -0.7568025 ] [-0.95892427 -0.2794155 0.6569866 0.98935825 0.41211849]
 [-0.54402111 -0.99999021 -0.53657292  0.42016704  0.99060736]

[ 0.65028784 -0.28790332 -0.96139749 -0.75098725 0.14987721]]
'''
ind = a.argmax(axis = 0) #获取上面矩阵中每一列最大值对应的索引值

print(type(ind)) #------<class 'numpy.ndarray'>

print(ind) #------[3 0 0 1 2]

colum_max = a[ind, range(a.shape[1])] #获得每一列的最大值

print(colum_max) #------[0.65028784 0.84147098 0.90929743 0.98935825 0.99060736]

七、排序

import numpy as np

#排序

a = np.array([[2, 4, 3], [5, 9, 7]])

b = np.sort(a, axis = 1) #按行进行排序

print(b) #------[[2 3 4], [5 7 9]]

c = np.sort(a, axis = 0) #按列进行排序

print(c) #------[[2 4 3], [5 9 7]]

a.sort(axis = 1) #也可以自己排序,不需要赋值

print(a) #------[[2 3 4], [5 7 9]]

d = np.array([1, 4, 7, 5, 3, 9])

i = np.argsort(d) #获得从小到大排序的索引值。

print(i) #------[0 4 1 3 2 5]

print(d[i]) #------[1 3 4 5 7 9]

八、读写文件

import numpy as np

#读文件
"""score.txt内容为
姓名 语文 数学 英语 政治 物理 化学
hyan 90 80 70 68 59 89
ytt 90 49 60 48 60 83
hy 83 94 73 62 95 93
cz 82 72 62 83 93 92
wh 82 94 72 62 62 71
hj 73 92 62 51 83 92""" data = np.loadtxt(fname = 'F:/ml/机器学习/01/score.txt', delimiter = ' ', usecols = (0, 1, 2), dtype = str, skiprows = 0)
#fname显示文件的路径;delimiter表示分隔符,默认是空格;usecols表示要选取的列数,如果只想选取第3列,usecols = (3,);dtype表示选取元素的类型;skiprows表示跳过头几行开始
print(data)
"""[['姓名' '语文' '数学']
['hyan' '90' '80']
['ytt' '90' '49']
['hy' '83' '94']
['cz' '82' '72']
['wh' '82' '94']
['hj' '73' '92']]""" data1 = np.loadtxt(fname = 'F:/ml/机器学习/01/score.txt', delimiter = ' ', usecols = (0, 1, 2), dtype = str, skiprows = 0, unpack = True)
#unpack = True相当于转置
print(data1)
"""[['姓名' 'hyan' 'ytt' 'hy' 'cz' 'wh' 'hj']
['语文' '90' '90' '83' '82' '82' '73']
['数学' '80' '49' '94' '72' '94' '92']]""" #写文件 ones = np.ones((2, 2), dtype = int) print(ones) #------[[1 1], [1 1]] np.savetxt('F:/ml/机器学习/01/ones.txt', ones) """其中ones.txt的内容为:
1.000000000000000000e+00 1.000000000000000000e+00
1.000000000000000000e+00 1.000000000000000000e+00
"""

九、 常见的一些函数

import numpy as np #导入numpy模块
from numpy import pi #一些函数的表现形式 a = np.arange(3) #得到一维数组------array([0, 1, 2]) np.exp(a) #e的指数------array([1. , 2.71828183, 7.3890561 ]) np.sqrt(a) #平方根------array([0. , 1. , 1.41421356]) np.arange(0.1, 0.5, 0.1) #得到一维数组,从0.1开始每个0.1得到一个元素一直到0.5(不包括)------array([0.1, 0.2, 0.3, 0.4]) b = np.arange(15).reshape(3, 5)#可以得到3*5的矩阵其中也可以用np.arange(15).reshape(3, -1)------array([[ 0, 1, 2, 3, 4], [ 5, 6, 7, 8, 9], [10, 11, 12, 13, 14]]) b.ravel() #将b的3*5的矩阵拉成一维数组------array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14]) np.zeros((3, 4)) #初始化3*4的矩阵,其中元素都为0. np.ones((3, 4), dtype = str) #初始化3*4的矩阵,其中元素都为1的字符串。 np.arange(0.1, 0.5, 0.1) np.random.random((2, 3)) #随机产生2*3的矩阵,元素范围在0-1之间------array([[0.23687761, 0.93173207, 0.25978851], [0.11452628, 0.31468911, 0.10254265]]) np.floor(10*np.random.random((2, 3))) #floor向下取整------array([[4., 9., 4.], [4., 3., 2.]]) np.linspace(0, 2*pi, 5) #0-2*pi之间取5个元素,强调的是先导入pi------array([0. , 1.57079633, 3.14159265, 4.71238898, 6.28318531]) np.sin(np.arange(10)) #sin()函数的应用------array([ 0. , 0.84147098, 0.90929743, 0.14112001, -0.7568025 , -0.95892427, -0.2794155 , 0.6569866 , 0.98935825, 0.41211849])
05-23 23:19