《Windows Azure Platform 系列文章目录

  在笔者的上一篇文章中:Azure SQL 数据库仓库Data Warehouse (2) 架构

  介绍了SQL DW的工作节点是Work Node,SQL DW是通过横向扩展Work Node的方式,解决PB级别的关系型数据库。

  1.有关Work Node性能指标,有一个概念叫做DWU。

  DWU简单来说就是CPU、内存、IO集合在一起的概念。

 

  请注意:Azure SQL DW的收费内容包含:

  (1)DWU的数量越大,则Work Node数量越多,价格越贵。大部分的费用来自于DWU

  (2)SQL DW的存储容量,数据库容量越大,则价格越贵。存储容量相对于DWU来说,占比较小

  2.由于数据中心的硬件升级,SQL DW的硬件有两种

  (1)第一代计算节点

  第一代计算节点是用DWU (Data Warehouse Units)来计算性能的。DWU的数值,除以100,就是实际的Work Node数量

  (1)DWU 100表示1个Work Node,这1个Work Node处理60个分区数据

  (2)DWU 200表示2个Work Node,每个Work Node处理30个分区数据

  (3)DWU 300表示3个Work Node,每个Work Node处理20个分区数据

  ...

  (4)DWU 6000表示60个Work Node,每个Work Node处理1个分区数据,这样并行度最高

  Azure SQL 数据库仓库Data Warehouse (3) DWU-LMLPHP

  (2)第二代计算节点

  第二代计算节点(Gen2),是用cDWU (compute Data Warehouse Units)来计算性能的,使用的硬件是NVMe SSD。

  优势是可以使用本地磁盘作为缓存,提高读取的性能

  Azure SQL 数据库仓库Data Warehouse (3) DWU-LMLPHP

  

  因为DWU的数量越大,则Work Node数量越多,价格越贵。所以我们在使用Azure SQL DW时候,要遵循以下几点:

  (1)创建一个比较小的DWU,开始做开发测试

  (2)通过azure Portal,观察DWU的利用率

  (3)当DWU在很长一段时间内,都处于峰值,则可以考虑将DWU进行扩大

  (4)SQL DW是通过横向扩展的方式,处理大数据类型。如果我们发现在扩大DWU之后,对性能不能提升,则需要考虑重新设计表结构,和查询语句

04-20 12:36