[原创]Greenplum数据库集群实践

GreenPlum实践

==============================================

  目录：

    一、安装环境准备

    二、GP数据库安装

    三、集群添加standby节点

    四、master和standby相互切换

    五、新增segment节点

    六、非Mirror模式为Segment节点增加Mirror

    七、Segment节点故障转移到Mirror并恢复segment

    八、迁移(替换)segment节点

    九、移除segment节点

    十、常用SQL和数据导入导出

    十一、GP集群中表的数据分布机制以及同步机制

==============================================

一、安装环境准备

  机器IP             角色

  192.168.156.144   master

  192.168.156.145   segment1

  192.168.156.146   segment2

  192.168.156.200   standby

Greenplum 需要在GP 数据库系统的所有主机(masters 和 segments) 上配置推荐的OS参数，以root用户登录，修改所有主机的OS参数

(1)、关闭防火墙(三台主机)(学习时可以直接关闭，正式环境是通过开放端口)

  #service iptables stop   停止防火墙服务，重启电脑后仍然会开启

  #chkconfig iptables off  关闭防火墙服务开机启动，重启后生效

(2)、修改/etc/hosts文件(三台主机)

  在hosts文件中添加或修改一下内容：

  192.168.156.144   master

  192.168.156.145   segment1

  192.168.156.146   segment2

  添加之后，可以通过ping命令测试是否正确，如：ping master测试是否能访问master节点

(3)、修改或添加/etc/sysctl.conf(三台主机)

kernel.shmmax = 500000000

kernel.shmmni = 4096

kernel.shmall = 4000000000

kernel.sem = 250 512000 100 2048

kernel.sysrq = 1

kernel.core_uses_pid = 1

kernel.msgmnb = 65536

kernel.msgmax = 65536

kernel.msgmni = 2048

net.ipv4.tcp_syncookies = 1

net.ipv4.ip_forward = 0

net.ipv4.conf.default.accept_source_route = 0

net.ipv4.tcp_tw_recycle = 1

net.ipv4.tcp_max_syn_backlog = 4096

net.ipv4.conf.all.arp_filter = 1

net.ipv4.ip_local_port_range = 1025 65535

net.core.netdev_max_backlog = 10000

vm.overcommit_memory = 2

(4)、配置/etc/security/limits.conf文件，添加以下内容(三台主机)

* soft nofile 65536

* hard nofile 65536

* soft nproc 131072

* hard nproc 131072

(5)、设置预读块的值为16384(三台主机)

  # blockdev --getra /dev/sda         查看预读块，默认大小为8196

  # blockdev --setra 16384 /dev/sda   设置预读块

(6)、设置磁盘访问I/O调度策略(三台主机)

  # echo deadline > /sys/block/sda/queue/scheduler

(7)、上传并解压数据库安装文件(master节点)

  # unzip gpmaster.zip

  之后的目录文件如下：

  greenplum_path.sh - Greenplum 数据库环境变量配置文件

  GPDB-LICENSE.txt- Greenplum license 文件

  LICENSE.thirdparty- 第三方 license 文件

  bin- 目录下包括Greenplum 数据库管理程序，也包括PostgreSQL 客户端和服务程序

  demo - 目录下包括Greenplum 演示程序

  docs - Greenplum 数据库帮助文档(PDF 格式)

  etc - OpenSSL 配置文件

  ext - Greenplum 数据库程序用的附加程序( 如 Python)

  include - Greenplum 数据库C header files

  lib - Greenplum 数据库和 PostgreSQL 库文件

  sbin - Supporting/Internal 脚本和程序

  share - Greenplum 数据库共享文件

二、GP数据库安装

1、安装软件(master节点)

  在/etc/profile中增加：# source /usr/local/gpmaster/greenplum_path.sh,然后在三台主机执行命令：source /usr/local/gpmaster/greenplum_path.sh

2.创建用户和节点文件

  # useradd gpadmin -m

  # passwd gpadmin

  在gpadmin账户下创建all_hosts，文件内容：(三台主机)

  master

  segment1

  segment2

3.运行gpseginstall工具(master节点 /home/gpadmin)在所有节点上安装GP软件,完成后提示成功.

  # chgrp -R gpadmin /usr/local

  # chmod -R 0775 /usr/local

  # su - gpadmin

  # gpseginstall -f all_hosts -u gpadmin -p gpadmin

4.切换到gpadmin用户验证无密码登录(三台主机)

  (1)切换用户

  # su - gpadmin

  (2)使用gpssh工具来测试无密码登录所有主机，结果如下图：

  # gpssh-exkeys -f all_hosts

  # gpssh -f all_hosts -e ls -l $GPHOME

5.配置环境变量(master节点)

  在/home/gpadmin路径下，以root用户添加下述信息到.bashrc和.bash_profile文件最后

    # source /usr/local/gpmaster/greenplum_path.sh

  然后将.bashrc文件发送到segment1和segment2,命令如下：

    # scp .bashrc segment1:~

    # scp .bashrc segment2:~

6.创建存储区域(master节点)

  (1)创建Master数据存储区域

    # gpssh -h master -e 'mkdir -p /data/master'

  (2)改变目录的所有权

    # gpssh -h master -e 'chown gpadmin:gpadmin /data/master'

  (3)创建一个包含所有segment主机名的文件/home/gpadmin/seg_hosts，内容如下：

    segment1

    segment2

  (4)使用gpssh工具在所有segment主机上创建主数据和镜像数据目录，如果没有设置镜像可以不创建mirror目录(切换gpadmin用户)

    # gpssh -f seg_hosts -e 'mkdir -p /data/primary'

    # gpssh -f seg_hosts -e 'mkdir -p /data/mirror'

    # gpssh -f seg_hosts -e 'chown gpadmin /data/primary'

    # gpssh -f seg_hosts -e 'chown gpadmin /data/mirror'

7.同步系统时间，需要安装ntpd。# yum install ntp -y

  (1) 在Master主机上编辑/etc/ntp.conf来设置如下内容：

      server 127.127.1.0

  (2) 在Segment主机上编辑/etc/ntp.conf

      server master

  (3) 在Master主机上，通过NTP守护进程同步系统时钟(切换gpadmin用户)

      # gpssh -f all_hosts -v -e 'ntpd'

8.验证操作系统设置(切换gpadmin用户)

  # gpcheck -f all_hosts -m master

  检查运行结果是否有error信息，如果有处理掉错误信息后重新执行上面的命令检查，直至没有error信息。目前知道的xfs相关的报错不影响安装。

9.创建Greenplum数据库配置文件

  (1) 以gpadmin用户登录

    # su - gpadmin

  (2) 从模板中拷贝一份gpinitsystem_config文件

    # cp $GPHOME/docs/cli_help/gpconfigs/gpinitsystem_config /home/gpadmin/gpinitsystem_config

    # chmod 775 gpinitsystem_config

  (3) 设置所有必须的参数

    ARRAY_NAME="EMC Greenplum DW"

    SEG_PREFIX=gpseg

    PORT_BASE=40000

    declare -a DATA_DIRECTORY=(/data/primary)

    MASTER_HOSTNAME=master

    MASTER_DIRECTORY=/data/master

    MASTER_PORT=5432

    TRUSTED SHELL=ssh

    CHECK_POINT_SEGMENT=8

    ENCODING=UNICODE

  (4) 设置可选参数

    MIRROR_PORT_BASE=50000

    REPLICATION_PORT_BASE=41000

    MIRROR_REPLICATION_PORT_BASE=51000

    declare -a MIRROR_DATA_DIRECTORY=(/data/mirror)

10.运行初始化工具初始化数据库

  # gpinitsystem -c gpinitsystem_config -h seg_hosts

  成功之后，数据库便启动了，出现Continue with Greenplum creation Yy/Nn>，输入 y，然后等待完成即可。初始化过程中遇到的报错如下：

  错误1：

  gpadmin-[FATAL][1]:-Failed Update port number to 40000

  解决：安装ed-1.1-3.3.el6.x86_64.rpm

  错误2：

  psql: FATAL:  DTM initialization: failure during startup recovery, retry failed, check segment status (cdbtm.c:1603)

  20180513:23:05:43:gpinitsystem:master:gpadmin-[FATAL]:-Failed to retrieve rolname. Script Exiting!

  解决：关闭防火墙。

11.设置环境变量：

  添加"export MASTER_DATA_DIRECTORY=/data/master/gpseg-1"到~/.bashrc文件尾，并同步到segment1和segment2节点。

    # scp .bashrc root@segment1:~

    # scp .bashrc root@segment2:~

12.启动和停止数据库测试是否能正常启动和关闭，命令如下：

  # gpstart -a

  # gpstop -a

13.访问数据库：

  # psql -d postgres

  postgres=# select datname,datdba,encoding,datacl from pg_database;

14.调整数据库参数,必须重新启动数据库:

  调整方法：执行命令 gpconfig -c 参数名 -v 参数值 -m Master节点值

  检查方法：重启数据库后，执行命令 gpconfig -s 参数名

  (1)调整

    #gpconfig -c shared_buffers -v 128MB -m 128MB

    #gpconfig -c gp_vmem_protect_limit -v 15360 -m 15360

    #gpconfig -c max_connections -v 1000 -m 200

    #gpconfig --skipvalidation -c wal_send_client_timeout -v 60s -m 60s

  (2)查看：

    #gpconfig -s shared_buffers

    #gpconfig -s gp_vmem_protect_limit

    #gpconfig -s max_connections

    #gpconfig -s wal_send_client_timeout

  或者

    # psql -d postgres

    postgres=# show shared_buffers;

    postgres=# show gp_vmem_protect_limit;

    postgres=# show max_connections;

    postgres=# show wal_send_client_timeout;

15.查看数据库状态：

  # gpstate

三、集群添加standby节点

  1.在standby节点的/etc/profile添加：# source /usr/local/gpmaster/greenplum_path.sh

  2.所有节点的/etc/hosts中添加：# 192.168.156.200 standby的配置

  3.按照安装前准备配置standby主机，然后在master节点的all_hosts文件中添加standby，重新建立ssh互信(root和gpadmin两个用户都要)，并复制必要的文件和环境变量。(在master上操作)

    # gpssh-exkeys -f all_hosts

    # gpssh -h standby -e 'mkdir -p /data/master'

    # gpssh -h standby -e 'chown gpadmin:gpadmin /data/master'

    # scp /usr/local/gpmaster standby:/usr/local/gpmaster

    # scp .bashrc standby:~

    # scp .bash_profile standby:~

  4.在master上执行以下命令初始化standby节点即可：

    # gpinitstandby -s standby

    # 如果是重新配置需要先删除原来的standby信息，然后在执行初始化：

    # gpinitstandby -r

    # rm -rf /data/master/*

    # gpinitstandby -s standby

四、master和standby相互切换

  1.在master上执行以下命令模拟宕机

    # gpstop -m

  2.在standby上执行以下命令切换为master身份顶替原来的master

    # gpactivatestandby -d $MASTER_DATA_DIRECTORY

    # 执行之前需要在gpadmin用户下的.bashrc文件下添加一下两个环境变量，否则会报错。

    # export MASTER_DATA_DIRECTORY=/data/master/gpseg-1

    # export PGPORT=5432

  3.切换完成之后在原来的master上删除/data/master/gpseg-1目录，然后在standby(现在的master)上初始化master，把原来的master变成standby角色。

    # gpinitstandby -s master

  4.然后可以重复上述操作把master恢复成master角色。

五、新增segment节点

  注：新增segment节点有两种情况：第一种是在集群中的原有机器中添加segment；第二种是新增主机，添加segment。Master节点存在Standby，

  GreenPlum认为Master有Standby，那么Segment就应该有Mirror，认为数据库开启了Mirror模式，如果实际segment没有mirror则查不到相关的资料，

  加入新节点会报错，以下操作在master执行了# gpinitstandby -r去掉集群的standby。

  1.按照安装流程把standby节点准备好，新加节点需要在master上的.bashrc文件指定#export PGDATABASE=dbtest环境变量，初始化时候需要把信息写到这个数据库。

  (本例是第二种把standby当成新节点加入，如果是第一种把newseg文件内容改为集群中现有的节点主机名即可，操作是一样的。)

  2.在master上新建newseg文件，内容为：standby，新加节点的主机名。

  3.执行安装前检查,如果有报错先进行处理。

    # gpcheck -f newseg

  4.检查ssh互信和时间

    # gpssh -f newseg -e date

  5.执行命令生成加入配置文件

    # gpexpand -f newseg

    # 输入y

    # 输入0或1 ，0表示只在新节点上初始化segment实例，1表示在所有segment节点初始化一个再加一个segment，新的节点是2个segment。这里输入0.

    # 生成gpexpand_inputfile_20180529_164324文件和gpexpand_inputfile_20180529_164324.fs文件(若还没有文件空间则没有.fs文件)

    # standby:standby:40000:/data/primary/gpseg2:4:2:p	--根据两个文件中的内容在各自的节点上创建好对应的目录并授权

  6.执行以下命令正式加入节点

    # gpexpand -i gpexpand_inputfile_20180529_164324 -S -V -v -n 1 -B 1 -t /tmp	--参数-S是表示用spread方式，不加是默认的group模式

    # 由于standby节点没有新建/data/primary目录导致报错执行# gpexpand -r -D dbdream回滚掉之前的操作，在回滚时也报错，发现数据库已经关闭，

    需要通过# gpstart -R将数据库启动到utility模式，然后回滚掉之前的添加Segment操作：gpexpand -r -D dbdream，回滚后再启动数据库# gpstart -a重新执行加入命令加入成功。

  7.segment添加成功之后如果需要将数据重分布则执行以下命令：

    # gpexpand -a -d 1:00:00 -D dbtest -S -t /tmp -v -n 1

    # 等待重分布完成

    # select * from gpexpand.expansion_progress;	--查看重分布进度

  8.清除gpextend产生的schema gpexpand

    # gpexpand -c -D dbtest

    # 输入两次y

六、非Mirror模式为Segment节点增加Mirror

  1.在所有segment节点上创建mirror的数据存放文件和文件空间所需的目录(如果有文件空间)

    # mkdir /data/mirror

    # chown -R gpadmin.gpadmin mirror

  2.在master节点上使用以下参数生成添加Mirror的参数文件

    # gpaddmirrors -o add_mirror

    # 输入mirror的数据目录：/data/mirror

    #生成文件内容如下，可以看到segment1对应的mirror0放到了segment2节点上，以此类推：

    # cat add_mirror

    filespaceOrder=

    mirror0=0:segment2:41000:42000:43000:/data/mirror/gpseg0

    mirror1=1:standby:41000:42000:43000:/data/mirror/gpseg1

    mirror2=2:segment1:41000:42000:43000:/data/mirror/gpseg2

  3.执行以下命令正式添加mirror

    # gpaddmirrors -i add_mirror

    # 添加完成会提示通过gpstate –s命令来查看Mirror的状态，Use  gpstate -s  to check the resynchronization progress。

  4.查看mirror信息

    # gpstate -m

  5.数据库查看mirror的信息

    # select * from gp_segment_configuration order by dbid;

  6.把初始化standby接入集群。

    # gpinitstandby -s standby

  7.此时GP集群正常，拥有master，standby实例，3个segment实例和3个mirror实例。

七、Segment节点故障转移到Mirror并恢复segment

  1.重启segment2节点主机，模拟segment2节点宕机。此时集群读写正常，但是standby节点的mirror切换为primary了，standby有两个primary，数据分布不均衡了。

  使用以下sql可以查看到各个节点之间的状态变化。(注意segment2重启后关闭iptables，否则执行# gprecoverseg 会很久并卡住)

    # dbtest=# select * from gp_segment_configuration order by 1;

     dbid | content | role | preferred_role | mode | status | port  | hostname | address  | replication_port | san_mounts

    ------+---------+------+----------------+------+--------+-------+----------+----------+------------------+------------

        1 |      -1 | p    | p              | s    | u      |  5432 | master   | master   |                  |

        2 |       0 | p    | p              | c    | u      | 40000 | segment1 | segment1 |            43000 |

        3 |       1 | m    | p              | s    | d      | 40000 | segment2 | segment2 |            43000 |

        4 |       2 | p    | p              | s    | u      | 40000 | standby  | standby  |            43000 |

        5 |       0 | m    | m              | s    | d      | 41000 | segment2 | segment2 |            42000 |

        6 |       1 | p    | m              | c    | u      | 41000 | standby  | standby  |            42000 |

        7 |       2 | m    | m              | s    | u      | 41000 | segment1 | segment1 |            42000 |

        8 |      -1 | m    | m              | s    | u      |  5432 | standby  | standby  |                  |

  2.恢复到原来的架构，有两种可能情况，第一种情况，当故障主机启动后，这台主机上的节点会自动启动，当然现在已经都是Mirror节点了，角色是不会切换的，

  而且数据是不一致状态。这种情况只需要使用gprecoverseg命令同步一下数据后，就可以切换到原来的架构了。第二种情况，当故障主机segment2启动后，

  这台主机上的节点并没有启动，而且在重启数据库时，这台主机上的节点也没有启动。以下操作针对第二种情况，需要使用gprecoverseg命令同步故障机节点的数据，

  如果数据量很大，同步要很长时间。

    # gprecoverseg

    # 会列出需要同步的节点，输入y

    # 数据同步完成，查看mirror节点的信息，mirror状态正常,但是当前角色还没有切换回来。# gpstate -m

  3.进行primary和mirror角色切换

    # gprecoverseg -r

    # 会列出需要切换的节点，输入y

    # 切换完成，使用gpstate –m查看mirror信息。

    # 使用# gpstate -e 命令有可能会看到主/备数据正在同步，这是正常的，过段时间同步好了再查看就正常了。

    # 还可以使用以下sql来查看数据库的切换信息，还有扩充segment和加mirror的信息

    # select * from gp_configuration_history;

八、迁移(替换)segment节点

  # 这里迁移standby主机上的primary和mirror到master主机，如果是新机器则按照“新增一个segment节点”步骤执行到第四步初始化好机器，无需执行gpextend，

  迁移过程中gp集群会自动将其加入。(迁移segment节点还可以手动停掉segment实例：# pg_ctl stop -D /data/primry/gpseg1，然后停集群，拷贝segment数据目录到目的迁移主机上，只修改status为d的记录主机为目的迁移的主机名重启做恢复和角色切换即可。)

  1)在master主机上创建对应的目录

    # mkdir {primary,fspc_primary,mirror,fspc_mirror}

    # chown -R gpadmin.gpadmin primary fspc_primary mirror fspc_mirror

  2)查看集群的节点信息并备份：

    # pg_dump -t gp_segment_configuration -c -f ~/gp_segment_configuration.dat

    dbtest=# select * from gp_segment_configuration;

     dbid | content | role | preferred_role | mode | status | port  | hostname | address  | replication_port | san_mounts

    ------+---------+------+----------------+------+--------+-------+----------+----------+------------------+------------

        1 |      -1 | p    | p              | s    | u      |  5432 | master   | master   |                  |

        4 |       2 | p    | p              | s    | u      | 40000 | standby  | standby  |            43000 |

        7 |       2 | m    | m              | s    | u      | 41000 | segment1 | segment1 |            42000 |

        8 |      -1 | m    | m              | s    | u      |  5432 | standby  | standby  |                  |

        2 |       0 | p    | p              | s    | u      | 40000 | segment1 | segment1 |            43000 |

        5 |       0 | m    | m              | s    | u      | 41000 | segment2 | segment2 |            42000 |

        3 |       1 | p    | p              | s    | u      | 40000 | segment2 | segment2 |            43000 |

        6 |       1 | m    | m              | s    | u      | 41000 | standby  | standby  |            42000 |

    dbtest=# select * from pg_filespace_entry;  --查看文件空间

     fsefsoid | fsedbid |        fselocation

    ----------+---------+---------------------------

         3052 |       2 | /data/primary/gpseg0

         3052 |       3 | /data/primary/gpseg1

         3052 |       1 | /data/master/gpseg-1

         3052 |       4 | /data/primary/gpseg2

         3052 |       5 | /data/mirror/gpseg0

         3052 |       6 | /data/mirror/gpseg1

         3052 |       7 | /data/mirror/gpseg2

         3052 |       8 | /data/master/gpseg-1

        16471 |       1 | /data/fspc_master/gpseg-1

        16471 |       2 | /data/fspc_primary/gpseg0

        16471 |       3 | /data/fspc_primary/gpseg1

        16471 |       4 | /data/fspc_primary/gpseg2

        16471 |       5 | /data/fspc_mirror/gpseg0

        16471 |       6 | /data/fspc_mirror/gpseg1

        16471 |       7 | /data/fspc_mirror/gpseg2

        16471 |       8 | /data/fspc_master/gpseg-1

  3)停掉集群

    # gpstop -a

  4)master方式启动集群

    # gpstart -m

  5)修改集群的节点信息

    # PGOPTIONS="-c gp_session_role=utility" psql -d postgres

    # set allow_system_table_mods='dml'; --获取修改系统表的权限

    # update gp_segment_configuration set hostname='master',address='master',status='d' where (content=1 and role='m');

    # update gp_segment_configuration set mode='c' where (content=1 and role ='p');

    # update gp_segment_configuration set hostname='master',address='master',status='d' where (content=2 and role='p');

    # update gp_segment_configuration set role = CASE WHEN preferred_role='p' then 'm' ELSE 'p' END where content=2;

    # update gp_segment_configuration set mode='c' where (content=2 and role ='p');

    dbtest=# select * from gp_segment_configuration; --查看修改后的配置

     dbid | content | role | preferred_role | mode | status | port  | hostname | address  | replication_port | san_mounts

    ------+---------+------+----------------+------+--------+-------+----------+----------+------------------+------------

        1 |      -1 | p    | p              | s    | u      |  5432 | master   | master   |                  |

        8 |      -1 | m    | m              | s    | u      |  5432 | standby  | standby  |                  |

        2 |       0 | p    | p              | s    | u      | 40000 | segment1 | segment1 |            43000 |

        5 |       0 | m    | m              | s    | u      | 41000 | segment2 | segment2 |            42000 |

        6 |       1 | m    | m              | s    | d      | 41000 | master   | master   |            42000 |

        3 |       1 | p    | p              | c    | u      | 40000 | segment2 | segment2 |            43000 |

        4 |       2 | m    | p              | s    | d      | 40000 | master   | master   |            43000 |

        7 |       2 | p    | m              | c    | u      | 41000 | segment1 | segment1 |            42000 |

  6)重启集群

    # gpstop -m

    # gpstart -a

    # 集群可以启动成功，但是会提示有2个segment需要恢复，此时standby节点上的segment不会启动了，相当于自动移除了。

  7)恢复master上的segment

    # gprecoverseg -F  --执行完全恢复

    # 输入y

    # 集群会自动在master上启动segment的进程并同步数据，但是此时master上的两个segment都是mirror，角色没有切换，需要手工切换，但是需要在数据同步完成之后执行。

    注意：恢复过程，数据越大，时间越长，需要注意使用# gpstate -m检查时，如果出现Resynchronizing字样，一定不能执行下一步操作，需要等状态变为Synchronized之后，

    才能继续下一步操作。

  8)数据同步完成后进行角色切换

    # gpstate -m  --查看数据是否同步完成

    # gprecoverseg -r

    # 输入y

    # gpstate -e  --切换后查看同步状态

    # 等待一段时间再次查看所有segment同步数据完成，状态正常。

  9)查看此时的节点信息和文件空间目录

    dbtest=# select * from gp_segment_configuration;  --节点的信息更新了

   dbid | content | role | preferred_role | mode | status | port  | hostname | address  | replication_port | san_mounts

  ------+---------+------+----------------+------+--------+-------+----------+----------+------------------+------------

      1 |      -1 | p    | p              | s    | u      |  5432 | master   | master   |                  |

      8 |      -1 | m    | m              | s    | u      |  5432 | standby  | standby  |                  |

      2 |       0 | p    | p              | s    | u      | 40000 | segment1 | segment1 |            43000 |

      5 |       0 | m    | m              | s    | u      | 41000 | segment2 | segment2 |            42000 |

      3 |       1 | p    | p              | s    | u      | 40000 | segment2 | segment2 |            43000 |

      6 |       1 | m    | m              | s    | u      | 41000 | master   | master   |            42000 |

      4 |       2 | p    | p              | s    | u      | 40000 | master   | master   |            43000 |

      7 |       2 | m    | m              | s    | u      | 41000 | segment1 | segment1 |            42000 |

    dbtest=# select * from pg_filespace_entry;  --可以看到最后四行被更新了

     fsefsoid | fsedbid |        fselocation

    ----------+---------+---------------------------

         3052 |       2 | /data/primary/gpseg0

         3052 |       3 | /data/primary/gpseg1

         3052 |       1 | /data/master/gpseg-1

         3052 |       5 | /data/mirror/gpseg0

         3052 |       7 | /data/mirror/gpseg2

         3052 |       8 | /data/master/gpseg-1

        16471 |       1 | /data/fspc_master/gpseg-1

        16471 |       2 | /data/fspc_primary/gpseg0

        16471 |       3 | /data/fspc_primary/gpseg1

        16471 |       5 | /data/fspc_mirror/gpseg0

        16471 |       7 | /data/fspc_mirror/gpseg2

        16471 |       8 | /data/fspc_master/gpseg-1

         3052 |       4 | /data/primary/gpseg2

        16471 |       4 | /data/fspc_primary/gpseg2

         3052 |       6 | /data/mirror/gpseg1

        16471 |       6 | /data/fspc_mirror/gpseg1

九、移除segment节点

  # 移除segment节点有两种方式，第一种是采用替换segment的步骤将要移除的segment的实例迁移到其他segment节点；第二种是全备数据库，删除节点后重新恢复数据，

  大数据量场景下耗时长。以下操作是第二种，将master上的segment节点移除掉(这里的移除的segment是包含了primary和mirror的，

  若只有primary则第四步中不需要执行update操作，第五步不用# gprecoverseg恢复操作)。

  1)备份数据库

    # gp_dump --gp-d=/home/gpadmin/backup dbtest  --该命令会备份每个segment的自己那部分数据在各自节点的指定目录下

  2)关闭数据库

    # gpstop -a

  3)master模式启动数据库

    # gpstart -m

  4)登录数据库

    # PGOPTIONS="-c gp_session_role=utility" psql -d dbtest

    # set allow_system_table_mods='dml'; --获取修改系统表的权限

    # delete from gp_segment_configuration where dbid in (4,6);

    # update gp_segment_configuration set content = 1 where dbid = 7;

    # delete from pg_filespace_entry where fsedbid in (4,6);

    # update pg_filespace_entry set fselocation='/data/mirror/gpseg1' where fsefsoid=3052 and fsedbid=7;

    # update pg_filespace_entry set fselocation='/data/fspc_mirror/gpseg1' where fsefsoid=16471 and fsedbid=7;

    # gpstop -m

  5)启动数据库并查看节点是否删除，并且执行同步操作恢复mirror

    # gpstart -a

    # gpstate -s

    # gprecoverseg

    # gpstate -e

    # gpstate -m

  6)恢复数据，只需要将移除节点上backup目录下的数据重分布到集群即可。

    # psql dbtest -f /home/gpadmin/backup/gp_dump_0_*

十、常用SQL和数据导入导出

  1.远程登录

    # create role usertest password 'test123' createdb login; //创建用户并授予登录和创建数据库的权限

    # alter role gpadmin with password ‘gpadmin’;

    # select rolname,oid from pg_roles; //查看用户信息

    # vi pg_hba.conf //添加以下内容

    host    all     gpadmin         192.168.156.145/32   md5

    # gpstop -u  //重新加载后才能使之生效，不需要重启数据库

    # psql -d dbtest -U gpadmin -h master -p 5432

  2.查看数据库集群的数据分布情况

    # select gp_segment_id,count(*) from tt group by 1 order by 1;

     gp_segment_id | count

    ---------------+-------

                 0 |     4

                 1 |     5

                 2 |     3

  3.查看表空间和文件空间对应关系，默认只有pg_segment一个文件空间，上面有pg_default和pg_global两个表空间

    # select a.spcname,b.fsname from pg_tablespace a,pg_filespace b where spcfsoid=b.oid;

  4.新建表空间

    1)先创建文件空间,master节点和所有segment节点

    # mkdir /data/fspc_master && chown -R gpadmin.gpadmin /data/fspc_master  (master和standby节点都要创建)

    # gpssh -f seg_hosts -e 'mkdir /data/fspc_primary'

    # gpssh -f seg_hosts -e 'mkdir /data/fspc_mirror'

    # gpssh -f seg_hosts -e 'chown -R gpadmin.gpadmin /data/fspc_primary'

    # gpssh -f seg_hosts -e 'chown -R gpadmin.gpadmin /data/fspc_mirror'

    2)创建文件空间

    # gpfilespace

    # 输入表空间的名字，名字随便起，但是不能使用gp_开头，输入：tablespace1

    # 输入Segment节点的文件空间目录：/data/fspc_primary

    # 输入Mirror节点的文件空间目录：/data/fspc_mirror

    # 输入Master节点的文件空间目录：/data/fspc_master

    # 生成一个类似gpfilespace_config_20180529_195239的配置文件，这个文件可以自己创建和修改

    3)正式创建文件空间

    # gpfilespace --config gpfilespace_config_20180529_195239

    4)创建完文件空间，即可在文件空间上创建表空间，创建表空间必须使用support权限用户

    # create tablespace tbs1 filespace tablespace1;

    5)设置用户默认就使用新建的表空间

    # alter role gpadmin set default_tablespace='tbs1';

    # grant all on tablespace tbs1 to gpadmin;

    6)在创建数据库时，指定数据库使用的默认表空间

    # create database tt tablespace tbs1;

  5.修改表字段和CTAS(create table as select)的方式创表

    # alter table tt alter column tt type bigint;

    # create table t_ctas as select * from tt;

  6.加载和卸载数据(必须要超级用户)

    # copy命令导入导出都要经过master，效率低下，适合数据量小的场景。数据量大，需要并发导入导出使用外部表gpfdist工具，

    直接从segment节点导入导出。数据加载还可以使用gpload工具，需要使用yaml语言编写gpload工具的控制文件。

    1)copy命令数据加载

    # copy tt from '/home/gpadmin/tt.txt' with delimiter ',' null '' LOG ERRORS INTO TT_ERRS SEGMENT REJECT LIMIT 100;

    # 指定null参数时，包含空值的数据可以成功加载，但是可能会遇到字段类型不匹配的情况，也就是错误数据，解决这个问题可以修改数据文件中错误的数据，

    还可以通过指定记录并跳过错误数据，将正确的数据加载到数据库，这是常用的方法，毕竟大多数情况都不知道数据文件中存在多少错误的数据，也可以修改数据文件中空数据为\N。

    2)copy命令数据卸载

    # copy tt to '/home/gpadmin/tt_output.txt' WITH DELIMITER AS ',';

    # 使用copy命令卸载数据时，空数据以\N的方式卸载，\N是null的转义

  7.查看表文件大小：

    # select pg_size_pretty(calc_partition_table('public','tt'));

    # select pg_size_pretty(pg_relation_size('tt'));

    # select pg_size_pretty(pg_database_size('dbtest'));

  8.查看活动会话：

    # select * from pg_stat_activity;

    # select pg_cancel_backend(procpid);  --杀死某次查询

    # select pg_cancel_backend(85475);

    # ps -ef | grep -i postgres | grep -i con

  9.表分析：

    # Vacuum analyze tt;

    # select * from pg_stat_user_tables where relname = 'tt';

  10.查看磁盘、数据库空间

    # SELECT * FROM gp_toolkit.gp_disk_free ORDER BY dfsegment;

    # SELECT * FROM gp_toolkit.gp_size_of_database ORDER BY sodddatname;

  11.查看日志

    # SELECT * FROM gp_toolkit.__gp_log_master_ext;

    # SELECT * FROM gp_toolkit.__gp_log_segment_ext;

  12.查看表占用空间

    # SELECT relname as name, sotdsize/1024/1024 as size_MB, sotdtoastsize as toast, sotdadditionalsize as other

    FROM gp_toolkit.gp_size_of_table_disk as sotd, pg_class WHERE sotd.sotdoid = pg_class.oid ORDER BY relname;

  13.查看索引占用空间

    # SELECT soisize/1024/1024 as size_MB, relname as indexname FROM pg_class, gp_toolkit.gp_size_of_index

    WHERE pg_class.oid = gp_size_of_index.soioid AND pg_class.relkind='i';

  14.查看锁

    # SELECT locktype, database, c.relname, l.relation, l.transactionid, l.transaction, l.pid, l.mode, l.granted, a.current_query

    FROM pg_locks l, pg_class c, pg_stat_activity a WHERE l.relation=c.oid AND l.pid=a.procpid ORDER BY c.relname;

  15.查看队列

    # SELECT * FROM pg_resqueue_status;

  16.OBJECT的操作统计

    #SELECT schemaname as schema, objname as table, usename as role, actionname as action, subtype as type, statime as time FROM pg_stat_operations

    WHERE objname = '<name>';

十一、GP集群中表的数据分布机制以及同步机制

  1)GreenPlum数据库支持hash分布(DISTRIBUTED BY)和随机分布(DISTRIBUTED RANDOMLY)两种分布策略，hash分布会计算分布键的hash值，

  相似的hash值的数据会放到同一个Segment节点上，和hash分区算法有些类似，这样，同样的分布键的数据肯定会分布到同一个Segment节点，

  这样在多表关联的时候，如果关联字段都是分布键，就可以在每个Segment节点关联后，Segment节点把结果发送到Master节点，再由Master节点汇总，

  将最终的结果返还客户端。而随机分布则不能保证同样分布键的数据分布在同一个Segment节点上，这样在表关联的时候，就需要将数据发送到所有Segment节点去做运算，

  这样网络传输和大量数据运算都需要较长的时间，性能非常低下，GreenPlum数据库不建议需要多表关联的表使用随机分布，也不推荐使用随机分布。

  还有一点，因为每个Segment节点都是独立的PostgreSql数据库，只能保证在单个Segment几点的数据唯一性，而随机分布不能保证整体数据的唯一性，

  而hash分布，相同分布键的数据会分配到同一个Segment节点，这样在单个Segment节点保证数据唯一性，也就保证了整体数据的唯一性。hash分布也是GreenPlum数据库的默认分布方式。

  2)建表时如果不指定分布键和分布策略，如果表中包含主键，默认会选择主键为分布键，如果表上有唯一约束但没有主键，那么默认选择唯一字段作为分布键，

  否则默认使用第一个字段作为分布键，并且使用hash分布策略。GreenPlum数据库不支持同时存在两个唯一的字段(复合主键除外)。如果建表时指定的分布键不是主键，

  那么GreenPlum会把表的分布键改为主键字段，而不是指定的字段，但是SQL语句中指定的分布键必须包含主键字段，而且主键字段必须在SQL指定的分布键的第一列出现才可以，

  否则会导致SQL无法成功运行。另外，随机分布不支持主键和唯一键，因为随机分布保证不了整体数据的唯一性。

  3)master和standby之间是使用流复制机制同步数据的，同步的是元数据，所以一般情况下同步很快完成。segment的primary和mirror之间是采用文件同步的方式。

  4)greenplum的两种节点分布模式：grouped和spread。grouped模式，默认的节点分布方式，主机的mirror节点全部放在下一个主机上，在segment主机数非常多的情况下，

  至少允许两台主机挂掉；spread模式，主机的第一个mirror在下个主机，第二个mirror在次下个主机，第三mirror在次次下个主机，在segment主机数非常多的情况下，

  只可以挂掉一台主机。执行初始化命令：gpinitsystem加上-S，节点分布方式为spread，如：# gpinitsystem -c gpinitsystem_config -h seg_hosts -S

  或者是：# gpexpand -f new_seg -S。