1.以下哪个不是数据缺失的类型(D)。
A.随机丢失
B.完全随机丢失
C.非随机丢失
D.故意丢失
解析:
数据缺失的类型包括:随机丢失、完全随机丢失和非随机丢失;随机丢失意味着数据丢失的概率与丢失的数据本身无关,而仅与部分已观测到的数据有关。完全随机丢失指的是数据的缺失依赖于不完全变量自身。非随机丢失数据指的是数据的缺失依赖于不完全变量自身。
2.以下选项中哪个可以输出DataFrame类型数据中data的行索引(B)。
A.data.columns()
B.data.index()
C.data.head()
D.data.info()
解析:
A.中的columns()方法是用来提取DataFrame类型数据中的列索引;
B.中的index()方法是用来提取DataFrame类型数据中的行索引;
C.head()方法显示data前n行数据;
D.info()函数用于给出样本数据的相关信息概览 ,包括行数,列数,列索引,列非空值个数,列类型,内存占用;
故正确答案选B。
3.在ndarray类型的数组中,以下哪项不是用于切割数组的函数(D)。
A.split()
B.array_split()
C.hsplit()
D.groupby()
解析:
ABC选项都属于ndarray类型数组的切割操作。
A项split()可以实现水平切割或者垂直切割,split必须要均等分;
B项array_split()可以实现水平切割或者垂直切割(强制切割),指定切割后的数目实现近似均匀切割;
C项hsplit()可以沿横轴(纵向)拆分原array,可以实现均匀切割或者指定位置切割;
D项groupby() 是用于pandas库中对DataFrame数据进行数据的分组以及分组后地组内运算;
故正确答案选D。
4.Matplotlib 使用plt.subplots(m,n)函数绘制多图的时候,下列说法不正确的是(C)。
A.plt.subplots()函数返回的是图形对象和所有的axes对象
B.ax.flatten()函数可以将m*n的子图展平成1*nm的axes组
C.subplot()函数和subplots() 函数相比,只创建了一个figure图形对象
D.axes对象使用set_title()函数为子图添加标题
解析:
选项A,plt.subplots(m,n)函数的返回值是一个元组,包括一个图形对象(fig)和所有的axes对象,其中axes 对象数量为m*n,因此A描述正确;
选项B,在用plt.subplots(m,n)画多个子图时,ax=ax.flatten()操作将ax由n*m的Axes组展平成1*nm的Axes组,因此B项描述正确;
选项C,subplots() 函数和 subplot() 函数使用方法类似。其不同之处在于,subplots() 既创建了一个包含子图区域的画布,又创建了一个 figure 图形对象,而 subplot()只是创建一个包含子图区域的画布。因此C项描述不正确;
选项D,ax.set_title()是给ax子图设置标题,当子图存在多个的时候,可以通过ax设置不同的标题;
故正确答案选C。
5.NumPy 库中提供了多种排序函数,下列哪种排序函数能够返回排序后的元素索引数组(B)。
A.numpy.sort()
B.numpy.argsort()
C.numpy.where()
D.numpy.nonzero()
解析:
A选项,numpy.sort()对输入数组执行排序,并返回一个排序好的数组副本;
B选项,numpy.argsort()对输入数组的元素值进行排序,并返回排序后的元素索引数组;
C选项,numpy.where() 的返回值是满足了给定条件的元素索引值;
D选项,numpy.nonzero()该函数从数组中查找非零元素的索引位置;
故正确答案选B。