1.以下哪个不是数据缺失的类型(D)。

A.随机丢失

B.完全随机丢失

C.非随机丢失

D.故意丢失

解析:

       数据缺失的类型包括:随机丢失、完全随机丢失和非随机丢失;随机丢失意味着数据丢失的概率与丢失的数据本身无关,而仅与部分已观测到的数据有关。完全随机丢失指的是数据的缺失依赖于不完全变量自身。非随机丢失数据指的是数据的缺失依赖于不完全变量自身。


2.以下选项中哪个可以输出DataFrame类型数据中data的行索引(B)。

A.data.columns()

B.data.index()

C.data.head()

D.data.info()

解析:

       A.中的columns()方法是用来提取DataFrame类型数据中的列索引;

       B.中的index()方法是用来提取DataFrame类型数据中的行索引;

      C.head()方法显示data前n行数据;

      D.info()函数用于给出样本数据的相关信息概览 ,包括行数,列数,列索引,列非空值个数,列类型,内存占用;

       故正确答案选B。


3.在ndarray类型的数组中,以下哪项不是用于切割数组的函数(D)。

A.split()

B.array_split()

C.hsplit()

D.groupby()

解析:

       ABC选项都属于ndarray类型数组的切割操作。

       A项split()可以实现水平切割或者垂直切割,split必须要均等分;

       B项array_split()可以实现水平切割或者垂直切割(强制切割),指定切割后的数目实现近似均匀切割;

       C项hsplit()可以沿横轴(纵向)拆分原array,可以实现均匀切割或者指定位置切割;

       D项groupby() 是用于pandas库中对DataFrame数据进行数据的分组以及分组后地组内运算;

       故正确答案选D。


4.Matplotlib 使用plt.subplots(m,n)函数绘制多图的时候,下列说法不正确的是(C)。

A.plt.subplots()函数返回的是图形对象和所有的axes对象

B.ax.flatten()函数可以将m*n的子图展平成1*nm的axes组

C.subplot()函数和subplots() 函数相比,只创建了一个figure图形对象

D.axes对象使用set_title()函数为子图添加标题

解析:

       选项A,plt.subplots(m,n)函数的返回值是一个元组,包括一个图形对象(fig)和所有的axes对象,其中axes 对象数量为m*n,因此A描述正确;

       选项B,在用plt.subplots(m,n)画多个子图时,ax=ax.flatten()操作将ax由n*m的Axes组展平成1*nm的Axes组,因此B项描述正确;

       选项C,subplots() 函数和 subplot() 函数使用方法类似。其不同之处在于,subplots() 既创建了一个包含子图区域的画布,又创建了一个 figure 图形对象,而 subplot()只是创建一个包含子图区域的画布。因此C项描述不正确;

       选项D,ax.set_title()是给ax子图设置标题,当子图存在多个的时候,可以通过ax设置不同的标题;

       故正确答案选C。


5.NumPy 库中提供了多种排序函数,下列哪种排序函数能够返回排序后的元素索引数组(B)。

A.numpy.sort()

B.numpy.argsort()

C.numpy.where()

D.numpy.nonzero()

解析:

       A选项,numpy.sort()对输入数组执行排序,并返回一个排序好的数组副本;

       B选项,numpy.argsort()对输入数组的元素值进行排序,并返回排序后的元素索引数组;

       C选项,numpy.where() 的返回值是满足了给定条件的元素索引值;

       D选项,numpy.nonzero()该函数从数组中查找非零元素的索引位置;

       故正确答案选B。

05-10 22:30