https://zhuanlan.zhihu.com/p/69187094

数据分析的源数据应该是规范的,而规范的其中一个标准就是数据源应该是一维表,它会让之后的数据分析工作变得简单高效。

在之前的文章中,我也经常强调一维表的易用性,也时常有人问我,什么是一维表,为什么要转为一维表呢,这篇文章就来帮你梳理清楚并告诉你如何将二维表转化为一维表。

什么是一维表

在Excel中常见的是二维表,你可能天天都在用,

数据可视化之PowerQuery篇(四)二维表转一维表,看这篇文章就够了-LMLPHP

而一维表是长这样的:

数据可视化之PowerQuery篇(四)二维表转一维表,看这篇文章就够了-LMLPHP

通过以上二维表和一维表的比较,你应该能分清楚什么是一维表、什么是二维表了,简单来说:

  • 一维表的每一列就是一个维度,列名就是该列值的共同属性
  • 一维表的每一行就是一条独立的记录

而这两点对于二维表,都不适合。

为什么要转为一维表

二维表更符合我们日常的阅读习惯,信息更浓缩,适合展示分析结果,但作为源数据进行数据分析时,就需要一维表。

一维表的每一列是一个独立的维度,列名或者字段名就是数据分析的基础,比如利用列名与其他表建立关系;编写DAX时直接使用列名;数据可视化时直接把字段拖入到某个属性框中等。

那么如何将二维表和一维表相互转换呢?

一维表变成二维表很简单,在Excel中都可以轻松做到,就是利用数据透视表,在PowerQuery中也有同样的透视功能,这里不再细说,下面主要介绍一下如何将二维表转换成一维表。

二维表转为一维表的方法

利用PowerQuery,二维表转为一维表十分方便,以Excel中常见的几种结构的表格为例,看看都是如何操作的。

第一种情形

简单的二维表,如本文的第一张图表,直接使用逆透视功能,就可以快速转为一维表,

数据可视化之PowerQuery篇(四)二维表转一维表,看这篇文章就够了-LMLPHP

可以选择需要透视的列进行“逆透视”,也可以选择不需要透视的列,然后点击“逆透视其他列”来完成。

提示:这些操作,生成的最终一维表的列名,需要自己手动更改一下,下同。

第二种情形

行标题带有层级结构的二维表,如下,

数据可视化之PowerQuery篇(四)二维表转一维表,看这篇文章就够了-LMLPHP

这种结构很清晰,但做数据分析最让人头疼的就是合并单元格,不过在PowerQuery中处理也并不困难,只是多了一些步骤。

将上表导入到PowerQuery编辑器后,先把年度列向下填充,将年度数据补齐,然后再进行逆透视,

数据可视化之PowerQuery篇(四)二维表转一维表,看这篇文章就够了-LMLPHP

第三种情形

列标题带有层级结构的二维表,如下,

数据可视化之PowerQuery篇(四)二维表转一维表,看这篇文章就够了-LMLPHP

这种表格可以先转置,转置以后,就是第二种情形,然后再进行逆透视就可以了,

数据可视化之PowerQuery篇(四)二维表转一维表,看这篇文章就够了-LMLPHP

第四种情形

行标题和列标题均带有层次结构,如下图,

数据可视化之PowerQuery篇(四)二维表转一维表,看这篇文章就够了-LMLPHP

看起来更复杂是不是,其实同样是上述几个步骤灵活组合,

a. 将年度列向下填充,补齐数据

数据可视化之PowerQuery篇(四)二维表转一维表,看这篇文章就够了-LMLPHP

b. 将年度列和季度列合并,生成年度季度列,这种结构就变成第三种情形,

数据可视化之PowerQuery篇(四)二维表转一维表,看这篇文章就够了-LMLPHP

c. 转置表、把第一列向下填充,并提升标题,就变成了很简单的结构,也就是第二种情形,

数据可视化之PowerQuery篇(四)二维表转一维表,看这篇文章就够了-LMLPHP

d. 选中前两列,逆透视其他列,就变成了一维表

数据可视化之PowerQuery篇(四)二维表转一维表,看这篇文章就够了-LMLPHP

e. 为了和源数据维度一致,将年度季度列进行分列

数据可视化之PowerQuery篇(四)二维表转一维表,看这篇文章就够了-LMLPHP

至此就得到了最终的一维表,看起来步骤很多,其实熟练掌握了也就分分钟的事。

总结

以上几种情形,基本包含了各种复杂结构的表格,如果有更复杂的表格,比如更多层级的行、列名,也同样可以按照以上的套路通过来分步完成:

1,将行层级先合并,转换成第三种情形

2,转置,变成第二种情形

3,逆透视

步骤中间熟练掌握填充、提升标题、分列等操作,关于转成一维表的问题,就没有什么表格能难倒你的了。

关于一维表的用处,不仅在PowerBI中,使用其他工具做数据分析时,同样需要这样的规范数据源。

下次再遇到二维表转一维表的问题,直接使用PowerQuery就行了。

04-28 10:38